“两个百万富翁在街头相遇,他们都想比较一下谁更有钱,但谁都不想透露自己到底有多少钱。如何在保护双方隐私且不通过第三方的情况下,得出谁更富有?”
这就是著名的“姚氏百万富翁问题”,由2000年图灵奖得主、中国科学院院士姚期智在1982年提出,问题描绘的是当前大热的隐私计算场景。在这一经典问题的基础上,姚期智进一步提出了多方安全计算理论(Secure Multi-Party Computation,MPC),隐私计算技术体系也由此发展而来。
随着人工智能、大数据等技术发展成熟,数据在当今世界扮演着日益重要的角色。“姚氏百万富翁问题”更是直指隐私数据计算在金融场景应用中的重要性。现实中,金融机构掌握了大量敏感信息,对数据安全要求较高。同时,金融业信息化建设较早,是当前数据生态中场景相对清晰、数据交易需求巨大的买家。据《财经》记者了解,有银行每年用于数据采购的费用就高达亿元。
当前金融数字化浪潮更是将隐私计算推向金融发展的战略高地。但如果不在源头做好制度建设,则可能引发隐私侵犯的恶果。
清华大学国家金融研究院院长朱民指出,最新统计结果表明,欧盟地区8%的GDP从数据中产生。但数据的大规模流动,也带来了数据泄露、滥用等风险。
近日,中国人民银行行长易纲在香港金融科技周公开讲话指出,此前已有大型科技公司未经允许收集并不当使用客户信息,甚至出现客户数据泄露事件,个人信息保护亟待加强。同时,易纲强调,要在充分保护个人信息的前提下,探索实现更加精确的数据确权,更加便捷的数据交易,更合理的数据使用,激发市场主体活力和科技创新能力。
如何在数据保护与合理使用之间维持平衡?业界对隐私计算寄予厚望。近日,首个隐私计算金融基础设施已落地。这项被称为多方安全计算平台的技术由光大银行和华控清交信息科技(北京)有限公司(下称“华控清交”)联合开发。
据平台承建方华控清交团队介绍,该平台能够使多个非互信参与方,在数据相互保密的前提下,对任意函数进行计算,实现“数据可用不可见,用途可控可计量”。
上线该平台后,光大银行得以联合母公司光大集团旗下保险、信托、旅游等成员单位,开展客户金融资产、消费偏好、风险偏好等数据的联合统计与建模,加强集团内部数据互联互通。
与以往业界落地的隐私计算应用不同,在该平台上,光大银行能够自行建设隐私计算场景。“二者区别相当于App和操作系统。”光大银行总行信息科技部副总经理王磊告诉《财经》记者,“这是金融业首个企业级数据流通基础设施平台,意味着隐私计算工程化取得突破性进展。”
技术平台的落地只是大规模数据资产交易起步的一个支点。“数据大规模流通的基础设施建设包括技术和制度两个方面。”华控清交董事长张旭东对《财经》记者表示,相比技术,制度建设更加关键。此前,《财经》记者曾报道更高层面指导文件即将出台,近期再度获悉,该文件或将扫清数据确权难等数据资产化的障碍,为数据的大规模流通提供更进一步指导。
数据资产化被业界看作是实现数据规范应用的重要方向,随着关键技术和相关制度的逐步完善,当今泛滥的数据交易将有望被导入正途。
首单隐私计算金融平台:
数据可用不可见
什么是隐私计算?
根据中国信息通信研究院的定义,隐私计算(或隐私保护计算)是一套包含人工智能、密码学、数据科学等众多领域交叉融合的跨学科技术体系,实现数据的“可用不可见”,其中关键技术包括联邦学习、多方安全计算、机密计算、差分隐私、同态加密等。
2021年8月26日,光大银行多方安全计算平台正式上线,首次让姚氏理论从实验室走上企业的生产线。
据悉,该平台可以保障各企业原始数据在“可用不可见”“可控可计量”的前提下,规范开展数据共享与融合应用,实现跨企业间隐匿查询、联合统计、联合建模等功能,可适用联合营销、联合风控、统一授信、业务合规等多种场景。
以光大信托和光大银行数据互通为例,光大银行私人银行客户与光大信托的客户同属高净值客户,但此前受制于合规要求,两大机构客户信息无法互通。当前,依托多方安全计算平台,光大银行和光大信托正将各自的高净值客户信息进行联合建模,挖掘出双方不重合的那部分客户,并针对这部分客户开展联合营销获客。这一过程中,双方均无法获知对方客户数据。
据王磊介绍,前述平台决策主要涉及两个方面考量。首先是安全性。“多方安全计算是从底层的运算符号开始加密,自下而上层层加密,在多个主流技术方案里安全等级最高。”其次是计算性能。由于加密运算量大,业内盛传多方安全计算存在计算效率较低、算力消耗大等缺点。对此,王磊表示,多方安全计算运算速度确实更慢,但性能差距并不显著。“测试结果显示,他们(解决方案的)性能是我们能接受的。”当前,该平台能够完成TB(太字节)级别的数据处理,王磊表示,对于数据共享来说,这个量级已经够用。
值得注意的是,此前金融行业已有多个隐私计算应用场景落地。例如,蚂蚁集团旗下蚂蚁链推出了摩斯多方安全计算平台,并依托该平台推出了联合营销、联合风控等应用场景,且在重庆富民银行等金融机构落地。
不过,多位受访者告诉《财经》记者,以往落地的隐私计算应用多是针对具体场景,相当于做了一个App,而光大银行多方安全计算平台类似一个可搭载多个App的操作系统,且设有通用编程接口,企业可根据自身需要开发新的场景应用。“将一个可编程可扩展的隐私计算平台嵌入银行生产系统,在业内尚属首次。”华控清交副总裁、金融板块负责人吕亚振强调。
此外,王磊向《财经》记者透露,除集团内部数据协同外,光大银行正在与多个集团外部企业探讨数据合作,未来可能共同开发联合风控等更多应用场景。
实际上,有银行业金融科技公司对《财经》记者直言,部分金融科技巨头或许技术能力上没有问题,但银行对基础设施建设的安全和合规要求非常高,决策过程中更倾向于纯技术公司。
以光大银行多方安全计算平台部署为例,华控清交副总裁、技术负责人黄斌告诉《财经》记者,该平台仅评审就耗时两个月,除常见的“同城双活”毫秒级无感切换等要求外,光大银行对系统合规性组织了八次评审会议,对400余项评审项目一一过审。过程中,评审方几乎把系统里每一段代码翻出来检查,操作系统版本必须是经认证版本,所有中间件必须在经认证的产品目录内。王磊坦言:“从初始产品到真正部署,基本让他们重新干了一遍。”华控清交团队将这一过程形容为“扒了一层皮”。
张旭东表示,该平台是当前业内唯一进入银行生产系统使用的基础设施平台案例。平台上线后,业界对此高度关注,多家金融机构就此与华控清交展开接洽。
此外,据《财经》记者多方了解,当前工商银行、交通银行、农业银行等银行的隐私计算平台项目也都在建设中。
数据安全流通:
联合营销、联合风控
光大银行对隐私计算的探索始于集团层面的协同需求。作为一家金融控股集团,光大集团旗下拥有财富、投资、投行、环保、旅游、健康六大业务板块,仅核心企业就有十余家。2018年,董事长李晓鹏提出构建财富E-SBU(光大生态协同战略),希望加强集团各业务板块间的业务协同,其中包括集团成员之间的数据互联互通。
与此同时,近几年国家对数据安全重视程度不断提高,金融机构掌握了用户大量敏感信息,其信息保护工作受到愈发严格的监管。“我们一直在思考,怎样用一种好的方式,既实现数据互联互通,又能保证数据安全。”王磊告诉《财经》记者。尽管是集团成员内部协同,但毕竟是两个独立法人,对于客户信息、交易信息的传输共享,光大仍然保持慎重。2020年底,央行发布《多方安全计算金融应用技术规范》金融行业标准,为金融机构的数据安全流通提供了技术规范和指导。同期,光大银行启动了隐私计算平台建设工作。
光大银行探索隐私计算的历程在当下颇具代表性。正如朱民所说:“数据本身并无价值,只有在使用时,数据才产生价值。”麦肯锡分析发现,2005年到2014年期间,跨境数据流动使全球GDP增长了约3%,数据流动所产生的附加值约为2.3万亿美元。为了挖掘数据资源背后的价值,各界都在自发探索数据共享流通的方式。
随着数据流动规模不断增长,与数据泄露相关的风险也逐渐暴露。近日,工信部通报了第20批,共38个存在超范围索取权限、过度收集用户个人信息等问题的App,涉及QQ音乐、腾讯新闻、小红书、豆瓣等知名应用。中国银保监会主席郭树清曾在公开讲话中指出,一些科技公司利用市场优势,过度采集、使用企业和个人数据,甚至盗卖数据。这些行为没有得到用户充分授权,严重侵犯企业利益和个人隐私。近年来,各国均在立法加强数据保护,如欧盟的《通用数据保护条例》,中国的《网络安全法》、《数据安全法》、《个人信息保护法》等。
数据流动与安全之间的矛盾日益突出,隐私计算被认为是解决这一矛盾的有效技术手段。从理论上说,隐私计算能够在不暴露原始数据的情况下,实现数据的融合使用,即“数据不动价值动”。另一方面,多方安全计算等隐私计算技术能够实现,精准控制数据融合使用的目的和方式,即控制数据算什么、怎么算,让数据使用监管成为可能。
张旭东将数据的融合使用形容为开化工厂,若将不同化学原料不加监管混合使用,可能产生巨大的风险。2021年外滩金融峰会上,清华大学五道口金融学院院长张晓慧指出,一些大型科技公司,尤其是数字平台公司处于算法支配地位,形成“算法霸权”,利用算法搞不公平排名、算法歧视(如大数据杀熟)、诱导消费者过度消费和承担风险等,严重危害算法相对人也就是消费者的合法权益。她呼吁,对算法实施公开透明的监管。
实际上,数据监管或许已经不远。据《财经》记者了解,华控清交已经与央行旗下金融科技子公司成方金融信息技术服务有限公司达成战略合作,为后者提供隐私计算相关技术支持。张旭东指出,《数据安全法》第六条规定,各地区、各部门对本地区、本部门工作中收集和产生的数据及数据安全负责,意味着行业主管部门必须对该行业数据的使用目的和方式进行监管,“数据监管势在必行”。
数据资产化还有多远:
确权、估值与交易
如何才能让数据发挥出最大的价值?朱民认为,答案是数据资产化。“在市场经济原则下,要更好地满足数据技术对数据规模、维度、密度的要求,就必须把数据从‘资源’变成‘资产’。”
2020年,国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》,将数据与土地、劳动力、技术和资本等生产要素相提并论,并提出“加快培育数据要素市场”。“国家提出把数据作为一种生产要素,就意味着数据可以作为一种资产。”光大银行副行长杨兵兵对《财经》记者说道。
朱民指出,数据资产化面临诸多难题,首先是数据的产权模糊,由此引申出了数据的隐私和安全问题,最后是估值和定价相对困难。此前,杨兵兵曾将数据资产化的三大必备要素总结为确权、估值和交易。
此前,业内针对数据的确权问题进行过激烈探讨,但一直未能真正确定数据权属。当前,将数据所有权与使用权、分配权等权属分离,进而推动数据流动的构想逐渐占据上风。
朱民指出,数据资产化可以借鉴中国土地所有制改革经验,将数据的所有权、使用权、经营权和分配权进行分离,不再争议所有权,而是通过授权机制,仅交易数据的使用权。
张旭东亦告诉《财经》记者,应该淡化所有权,侧重数据的控制权和使用权。
重庆市原市长、复旦大学特聘教授黄奇帆则认为,数据涉及管辖权、交易权、所有权、使用权和财产分配权等五项基本权利,各类主体基于自身在数据交易环节中的位置来行使相应权利。值得注意的是,黄奇帆认为,个人的基本信息和基于自身行为产生的各种数据,个人理应享有所有权。该类数据变现形成的收益,理应向个人分配。
据《财经》记者了解,即将出炉的高层文件将就数据确权问题给出更加明确的指导。
确权问题之后,另一个让业界头疼的难题是数据估值。朱民指出,数据价值很难用成本法来计算,而以收益法计算则要考虑权利金的节约、超额收益和增量收益等多重因素。以市场法估算数据价值需要每一个所有者、经营者、使用者和分配者都在其中公平地分享的一个权重,共同投资数据,共同分享长期收益。
黄奇帆则提出,应发挥市场在数据资源配置中的决定性作用,由交易的双方根据数据的价值协商确定价格。
实践中,对数据估值的探索早已在进行。2021年1月,光大银行发布《商业银行数据资产估值白皮书》,从成本法、收益法、市场法三大经典估值体系出发,探讨数据估值。
近日,姚期智院士在以《数字经济领域的核心科技》为题的演讲中,首次介绍了数据要素定价理论与实现算法。该算法由姚期智领导的团队研发,并由交叉信息核心技术研究院金融科技与监管科技中心团队探索实践。
另一方面,正如黄奇帆所说,业内期待市场在数据估值中起关键作用,即在流通中逐步完善定价。
杨兵兵曾建议,鼓励合规数据交易的先行先试,同时逐步理清各类数据主体与相对应的权益,再全面构建和完善金融数据交易市场的体制机制与法律合规等框架。现实中,光大银行当前每年都要花费近亿元从外部采购数据。
王磊告诉《财经》记者,当前银行采购的数据主要是公共数据,比较敏感的如个人数据属于监管红线,无法进行交易。此外,线下点对点交易存在诸如合规风险等系列问题,各方都在期待一个更高效、规范的数据要素市场。
针对数据流通环节,朱民提出了三种可能的商业模式,数据平台交易模式、数据银行模式和数据信托模式。其中,以数据交易所为主要形态的数据平台交易模式当前已在多地实施。
2021年3月31日,基于“数据可用不可见,用途可控可计量”新型交易范式的北京国际大数据交易所(下称“北数所”)揭牌成立。
值得注意的是,数据资产化的探索很难一蹴而就。一位业内资深专家告诉《财经》记者,基于数据生产要素的产业发展需要一个过程,当前业界仍然处于早期探索过程中,数据产业未来将是什么形态,仍然存在很多变数。