蚂蚁密算科技有限公司副总裁李宏宇:数据价值化的核心在于数据可信流通的基础建设

来源:财经网 2024-09-28 17:04:10

9月27日,由全球数字贸易博览会组委会办公室主办,杭州市商务局,杭州高新区(滨江)管委会、政府,《财经》杂志,《财经智库》承办的“第三届全球数字贸易博览会数字技术贸易产业对接会”在杭州举行。蚂蚁密算科技有限公司副总裁李宏宇在大会上表示,密态计算是一种隐私保护计算技术,能全流程、全链路保持数据密态化,从底层有效防范数据泄露和滥用风险,实现数据可信流通。

图片1_副本

蚂蚁密算科技有限公司副总裁  李宏宇

李宏宇提到,随着企业数字化转型,数据已成为资产,企业需要盘活并结合外部数据以助力业务发展。然而,数据交易中存在数据质量参差不齐、数据价值难以评估的问题,这时候价值验证成为数据交易的核心问题。

他谈到,数据交易不同于传统商品交易,其价值验证具有“盲盒”现象,即数据价值难以评估,存在安全风险,如何去验证数据的价值,就成了关键的问题。在他看来,数据价值存在两面性,高价值数据风险高。数据价值化需要数据跨主体、跨行业、跨地域流动,面临外循环安全的新挑战。

李宏宇强调,数据价值化需要数据可信流通的基础,而密态计算是一种隐私保护计算技术,能全流程、全链路保持数据密态化,从底层有效防范数据泄露和滥用风险,实现数据可信流通。密态计算中心通过高效安全的价值验证服务,能保障数据源的安全进而维护数据的价值稀缺性;同时为数据消费者链接数据源和数据研发者,提供快速价值验证的途径。

在金融、政务、保险、医疗、民生等行业,蚂蚁密算均已有实践,如与农业农村部大数据发展中心合作的案例中,通过密态计算快速验证数据在农户贷款业务中的价值,服务农户数量和授信金额显著增长。保险新能源车险定价难题也通过密态互联网络结构得到解决,为车主平均降低保费8%。

在地方公共数据侧,蚂蚁密算发布了杭州市第一个密态计算中心,旨在通过密算中心方式开放数据密态研发服务,对外赋能,激活公共数据价值。

最后他提到,密态计算技术虽起步不久,蚂蚁密算已积累和沉淀了很多专利,但产业需要行业合作伙伴共同推进。数据价值化的核心在于数据可信流通的基础建设,通过密态计算实现数据要素的“乘聚变”效应,也需要大家一起参与。

以下为部分发言实录:

李宏宇:非常感谢袁主编,刚才已经介绍了我今天想和大家分享的内容,也是我们在数据交易过程中遇到的一些问题和实践思考。‘

刚才赵总已经说到了,很多企业已经在数字化转型过程中汇总了很多数据,未来数据肯定会成为资产,这些数据需要盘活。同时,他们还会需要更多外部数据,进一步助力自己的业务。这里就会面临一个问题,数据需要去做交易。但在数据交易时,有时候买过来的数据质量很差,或者对于业务帮助效果不大,这其实就是今天的主题数据交易的核心挑战:数据价值验证。

首先看一下数据交易行业,过去这几年已经快速发展。今年数博会,北交大张教授发布了一个“数据产业图谱”,2023年整个数据产业大概在2万亿的规模。过去这几年都是呈现25%左右的增速。可以想象GDP现在的增速是多少,未来这几年还会持续的增加。在2023年统计的另外一项数据里,全国参与数据交易类企业大概有15万家,这个规模是非常大的。但大多数企业都是最近一年才成立的,可见这个新兴的市场已经在快速发展。一方面是因为数据成为生产要素,另外一方面,人工智能大模型的发展已经让我们感受到了数据的重要性。大模型需要很大的数据量,过去我们也做过很多智能客服、智能顾问这些所谓的应用。你会发现过去很多智能客服都被我们戏称为“人工智障”,你跟它聊的东西,它回答和你想要的完全不一样。背后根本原因是数据喂的不够多,你喂多少数据,人工智能模型才能产生多少能力。此外,也需要大量的专家来去做相应的数据产品加工和标注。而有专业的Knowhow的专家,碰不到数据。有数据的企业,他们又很害怕数据拿出去被泄露了,这就成为一个问题。

数据交易不同于传统商品的交易。传统商品交易最大的特点,我看到这个商品基本上知道它的使用价值是什么了,它是非常清晰的。但我拿到数据时如果无法做一个深度的加工和挖掘,其实是很难能评估数据对于我的业务效果会产生多大的影响,所以说数据价值其实是有一个“盲盒”现象的。盲盒现象导致消费者虽然很需要数据,但会很谨慎去购买。

如何去验证数据的价值,就成了我们一个关键的问题。数据的价值验证本身还存在着“两面性”,越是高价值的数据,它存在的风险越高,它被泄露的可能性越大。目前高价值数据单次泄露成本大概在400多万美元左右。这就要求我们要用更安全的方式流通数据,如果做不到这一点,原来的数据产品可能从稀缺资源变成一个很普通的产品,数据价值降低了。同时,数据价值还是需要进一步挖掘,当很多数据源融合在一起时,数据价值才更大。但这时候需要专业的团队,而多数据源方可能找不到一个大家共同信任,且能挖掘出数据价值的专业团队。这时候需要看一下数据价值化的核心,应该是解什么问题。

数据首先要和行业场景结合在一起,才能产生数据的价值。同时,数据需要跨主体、跨行业、跨地域流动,才能够真正实现价值,这里核心的问题是说过去所有数据使用只是在企业内部来进行使用,这是一种内循环。现在数据需要跨主体流动,它已经成为了一个外循环的问题。过去内循环安全相对来讲更简单,可以通过自己内部的体系防御实现,但当外循环的时候,没有那么简单了,所以说外循环面临的一系列挑战是数据流通的关键。

这里就需要数据可信流通,才能真正做到数据价值化,一种实现方式是密态计算。密态计算是一种隐私保护计算的技术,核心在于全流程、全链路,数据都是保持密态的,计算过程当中产生的数据也是密态的形式,后续产生的一系列复杂的组合计算也是基于密态的,这样就能真正从底层上防范数据泄露和滥用风险。通过密态计算,可以实现数据可信流通,进一步激发数据要素的“乘聚变”效应。

密态计算一方面连接更多的数据源;另一方面,可以链接数据加工者,让他们协作产生数据价值。密态计算能提供高效安全的价值验证服务,在这样的价值验证服务里,它是分两层的:一层是对于数据源方,对数据源、数据提供方来讲,它更关心的事情是数据能够卖出去,但要安全。传统的价值验证方式是请人过来加工,很不方便。要不然把数据给你,委托加工,容易产生数据安全风险问题。通过密态计算的方式,可以密态供数,数据接入时就是密态的。数据接入到里面加工使用时,都是密态的,可以保证使用可管控,数据价值的稀缺性就能保障住。同时,全链路可追溯、可审计的,真正发生数据价值损失时可以定责、追责,数据供给方的利益可以有保障。

对于数据消费者来说,可以通过密态计算的方式链接更多数据源,快速验证数据价值。同时数据消费者在不知道数据好坏时,不需要走很长时间申请流程申请数据使用授权,避免无效申请,而且因为是密态研发采用了合成数据或混淆数据结合的方式,也不存在安全合规风险。当数据价值一旦验证好了之后,在实际业务场景可以快速规模化复制。

我们在金融、政务、保险、医疗、民生等相关产业当中做了一系列实践。现在因为产业数字化转型才刚刚起步,未来可能需要把很多供应链、产业链的数据汇集在一起。但说实话,这些产业链、供应链上的企业并不一定能相互信任,通过密算中心可以把数据更安全可信的汇聚一起。在上层服务中,对于所有上下游企业都可以提供应用服务,包括最常规的金融服务,都可以因此而产生。

基于这样基本的架构,我们也跟农业农村部大数据发展中心合作,汇集了多方数据进行融合建模,快速验证数据在农户贷款业务中的价值。这里有一组数据,去年底的时候,服务的农户只有260万,但到了今年5月份,它已经快速复制到600多万农户,授信金额达到千亿规模。

另外,我们连接了很多保险公司和一些新能源汽车数据,这样就形成了密态互联的网络结构,也是验证了保险新能源车险在定价过程中的难题。大家都知道买新能源车最大的痛苦是买保险时定价非常高的,怎么样实现精准的定价,可以通过这样一种方式为车主平均降保费达到8%。我们最开始只有2家保司一起参与做这件事情,一旦其他保司看到效果之后立马复制到十几家,现在还在持续规模的扩充。

我们也同时在地方公共数据这一侧做了很多事情,前两天我们刚刚发布了杭州市第一个“杭州市密算计算中心”,也是希望通过密算中心方式开放公共数据,对外赋能,产生更多的价值。我们现在知道公共数据是有金矿的,但金矿还藏在背后,一直没有真正规模化的开放出来。通过密算中心的方式,可以让密算的研发服务链接更多生态,真正激活公共数据的价值。

密算技术刚刚兴起,也就这几年的时间快速发展起来,整个产业还需要实践验证,也需要在座的产业界同行们一起来验证和培育密算产业。欢迎有合作意向的,可以一起来探讨。过去这几年我们在这个领域积累沉淀了很多技术,发明专利数量全球第一,也参与了70多项标准制定。但数据产业最重要的一点还是要和行业结合,需要更多合作伙伴一起推进。

这是我今天分享的主要内容,价值验证是数据交易的核心挑战,数据可信流通是数据价值化核心,密态计算是数据可信流通的基础,可以实现安全高效的数据价值验证,进而激发数据要素“乘聚变”效应,让我们大家一起努力。

谢谢大家!