千亿数据要素市场待启

来源:《财经》杂志 2021-11-30 16:55:54

7月20日,一场史上罕见的暴雨袭击郑州,中原腹地沦为泽国。当晚8点57分,一个名为《待救援人员信息》的在线协作文档出现在朋友圈中。据统计,24小时内,该文档被访问250多万次,数百人在线协作,更新了270多版,向外传递了超过1000条求助内容、近100个避险地点等救援信息,成为一个实时更新的大型救援信息中转站。

一个文档,承载了人与人之间守望相助的温情,也成为中国数字经济发展的缩影。从1993年建立第一条国际计算机网络专线至今,中国近10亿人接入互联网,上传数据、传输数据、使用数据几乎成为每个人的生活日常。中国信息通信研究院(下称“信通院”)最新发布数据显示,2020年,中国数字经济规模扩张至39.2万亿元,占GDP比重接近40%。

2017年,中国国家主席习近平提出,“构建以数据为关键要素的数字经济”。数据要素在经济发展中的重要性进入决策层视野。2020年,国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》(下称《意见》),将数据与土地、劳动力、技术和资本等生产要素相提并论,并提出“加快培育数据要素市场”。

从一串字符到与土地、资本、劳动力、技术等生产要素并驾齐驱的生产资料,背后是中国经济数字化转型带来的巨变。“数据已经成为优化分配和使用自然资源和社会资源的关键依据。”华控清交信息科技(北京)有限公司(下称“华控清交”)董事长张旭东告诉《财经》记者,对内,数据要素是经济进入新发展时期后,提高发展质量和效率的抓手;对外,是中国实现“换道超车”的关键路径。“党和国家这是点到要穴了。”

数据要素如何市场化?光大银行总行信息科技部副总经理王磊告诉《财经》记者,其中至少涉及确权、定价、交易三个核心环节,但在实际操作中,第一关确权就难倒业界。“你在微信上的行为数据,到底属于你还是属于腾讯?这个数据产生的收益是不是该分你一份?”多位受访者告诉《财经》记者,此类问题至今仍然无解。光大科技有限公司(下称“光大科技”)副总经理向小佳直言:“收益分配在技术上好解决,但首先需由法律来明确如何分配。”

事实上,除权属复杂外,数据还具有可共享、价值易变、零成本复制、非实体无消耗等特性,导致明文交易的数据容易失去价值。此外,不同维度的数据融合使用还可能产生难以预料的风险。如何让数据安全流转也是业界当前探索的重要方向。

尽管如此,多位受访者对《财经》记者坦言,实践中数据已经在流通。据王磊透露,光大银行每年需花费近亿元采购数据。初步估算,商业银行每年数据交易金额超过百亿元,整个市场规模上千亿元。不过,线下点对点交易存在诸如合规风险等系列问题,各方都在期待一个更高效、规范的数据要素市场。

据《财经》记者了解,数据要素市场关联方至少包括数据交易主体、数据交易平台和数据交易中介等。当前,金融机构、金融科技企业、数据基础设施服务商、互联网巨头、高校以及各地的大数据交易所均在积极参与探讨和实践。

与此同时,地方政府也在积极推动数据要素市场化。7月5日,广东省印发《广东省数据要素市场化配置改革行动方案》,率先试水。次日,深圳发布《深圳经济特区数据条例》,首次通过立法规范数据处理活动,保护相关各方合法权益,促进数据作为生产要素开放流通和开发利用。“这标志着它(数据要素市场建设)已经进入落地环节,进入筹备期了。”王磊表示。

此外,《财经》记者多方获悉,更高层面的数据要素市场建设指导文件正在起草当中,最快将于年内发布。届时,数据要素市场建设将迎来更多实质性进展。

生产:从计算原料到生产资料

世界是由什么构成的?

如果拿这个问题去问程序员,毫无疑问这个答案会是0和1。1945年,美籍奥地利数学家——冯·诺依曼创造性地提出用二进制替代十进制,让计算机按照程序顺序执行计算命令的构想,实现了对复杂数据的高效稳定计算。

随着技术发展,0和1覆盖的数据形式从数字拓展到文字、图片、声音、视频,数据总量更是爆炸式增长。据信通院报告,预计2020年全球数据总量达到47ZB(十万亿亿字节)。冯·诺依曼一定没有想到,这一堆由0和1构成的数据即将成为人类社会最核心的生产要素之一。

在张旭东看来,随着大数据、人工智能等技术的发展和成熟,数据的主要使用主体从人变成了机器。由此,基于大数据的决策和优化照进现实,将数据与其他生产要素融合,就能优化资源配置,提高生产效率。

“技术对信息的处理方式落到了数据上,在新的经济发展阶段,数据成为经济优化的基础依据,所以它能跟土地、劳动力、资本、技术等生产要素并驾齐驱,成为社会生产力的重要组成部分。”2011年以来,中国GDP增速从9%以上,逐渐下降至6%左右,经济由高速增长向高质量增长转变,同时数字经济占GDP的比重逐渐上升至接近40%。作为数字经济的核心要素,数据要素被视为转变经济发展方式的抓手。

另一方面,与芯片等领域不同,中国在大数据、云计算等技术上与国外差距不大,且由于数据化做得更好,在数据量上有较大优势。中国国家信息中心主任刘宇南披露,到2025年,中国数据总量预计将跃居世界第一,全球占比有望达到27%以上。“技术、资本等生产要素上,国内没有特别的竞争优势,但依托丰富的数据资源驱动传统企业进行数字化转型,可能会成为实现竞争优势的一个突破口。”光大科技大数据部负责人田江总结道。张旭东称之为“换道超车”。

内外需求叠加,决策层对数据要素的重视程度与日俱增。2017年,中国国家主席习近平提出,“构建以数据为关键要素的数字经济”,确立了数据在数字经济中的关键地位;2019年,十九届四中全会首次提出,将数据作为生产要素参与分配;2020年,国务院发布《意见》,将数据与土地、劳动力、资本和技术四大生产要素并列,并明确提出“加快培育数据要素市场”;今年3月,“十四五”规划进一步提出“激活数据要素潜能”。

“数据作为生产要素参与市场分配已经在国家层面达成统一,加快数据要素流通交易,激发数据资产价值转化,已经成为数字中国建设的关键引擎。”王磊评价道。

值得注意的是,原始数据不等同于数据要素。原始数据经过数据治理(收集、加工、清洗、打标签等)后,变成了数据资源或数据资产,数据资源/资产进入流通领域后,才形成数据要素。

截至目前,商业银行、互联网企业、大数据公司等机构都有能力将原始数据变成数据资产,但接下来的问题却难以解决,数据要素应该属于谁?

确权:让数据先流通起来

科斯定理告诉我们,只要一件物品的产权得到清晰界定,那就可以进入市场流通交易。改革开放以来,劳动力、技术、资本等生产要素都经历了明确产权的过程,然后才能通过市场化机制流通、盘活。

由此,数据要素的确权问题也成为关注焦点。今年全国“两会”期间,多位人大代表提议完善数据要素市场相关配套法律制度,数据确权问题更是被反复提及。近期,中诚信国际首席经济学家毛振华撰文指出,清晰的产权界定是数据要素通过市场竞争、交易、定价实现高效配置的前提和依据。

但数据要素确权存在很多现实困难。“数据确的是什么权?是知识产权还是财产权?法律上没有明确定义。”一位大数据专家对《财经》记者直言。在他看来,知识产权和财产权的确权方式完全不同,法律没有予以界定,后续问题无从谈起。

事实上,多位受访者告诉《财经》记者,确权首先是个法律问题。当前中国与数据相关的法律主要是《中华人民共和国数据安全法》和《深圳经济特区数据条例》,其中对数据的定义都是“任何以电子或者其他方式对信息的记录”,并不涉及权利的定义和划分。

王磊表示,数据要素在创造、加工、共享等过程中涉及大量角色,如数据的生产者、所有者、使用者、管理者、出售者、购买者等,同一主体可在数据要素流通过程中同时承担多种角色。如何充分识别各种角色,同时保障各方合法权益,是确权的难点所在。

“数据确权最大的难点在于它同时具备权益性和资产性,且高度融合。”张旭东告诉《财经》记者。所谓权益性,是指数据被采集方的自我保护和利益主张权;资产性,则是数据控制方花费成本采集、加工、整理或购买数据后,对数据的控制权和收益权。权益性和资产性如何权衡?“在中间能找到一条黄金分割线,让两边都没有意见吗?没有。”他坦言。

尽管观察角度不同,但上述人士均对《财经》记者表示,就当前情况来看,数据确权难度很大。

不过,这并不意味着数据要素市场只能停滞不前。

在王磊看来,生产要素市场的繁荣涉及三个核心步骤,确权、定价和交易。传统经济学框架下,三个步骤按部就班完成。但数据要素的确权在法律上难以推进,不如先推动交易,用数据要素市场的繁荣来推动确权。“价值能够实现,确权才有意义。”

“我认为现在更好的方式是淡化所有权这个概念,”张旭东亦表示,“至少有两件事是比较清楚的,就是数据的控制权和使用权。”他进一步提出,控制权对应着保护数据的责任,使用权则对应经济利益,数据控制方通过使用数据,或出让使用权获得收益,同时对数据相关的安全问题负责。总而言之,搁置争议,让数据要素先流通起来。

流通:警惕数据融合风险

“数据使用安全是数据流通的第一必要条件。”谈及数据流通,张旭东向《财经》记者强调。当前,数据流通中的安全问题主要包括数据泄露风险和数据融合使用风险。

明文数据一旦被“看见”,就会暴露信息,即可被无限复制和无限制使用,供给曲线和需求曲线无限大时,市场无法通过有效供需对数据要素定价,更遑论大规模流通。

同时,数据大规模流通和融合使用具有较强的负外部性。“木炭、硝酸钾、硫磺,单个物质在常温下化学性质都很稳定,但按照一定比例混合就成了炸药。”在张旭东看来,不同维度数据的融合使用如同开设“数据化工厂”,一不小心就会触发危险的“化合反应”,侵犯个人隐私、商业机密,甚至危及国家安全。

事实上,当前各类数据尚未大规模流通、融合的情况下,数据融合使用的负外部性已初见端倪,大数据杀熟、困在系统里的外卖员等事件,都在提示数据融合使用可能带来的潜在风险。

“目前对于数据的分级分类和相关风险评估和管控通常只注重该数据本身的泄露风险,”张旭东进一步强调,“亟须建立对多方数据融合计算的目的和方法进行管控的机制。”

但一刀切的保护同样不可取。毛振华指出,2018年5月正式生效的《欧盟通用数据保护条例》(GDPR)导致欧盟境内企业融资金额下降约26.5%,就业岗位减少了5000个-3万个。“该条例在个人数据产权界定与保护方面是一个很好的示范,但其产权实现方式不符合数字经济发展要求,企业使用数据需要付出的成本高于所能获得的收益,反而抑制了数据使用者的积极性。”

如何在数据使用和数据保护之间取得平衡?业界找到的答案是隐私计算。

所谓隐私计算,是指在保护数据本身不对外泄露的前提下,实现多方数据融合计算分析的一类信息技术,需要密码学、计算机、大数据、人工智能等众多技术体系的交叉融合。当前,业内关注度较高的包括基于密码学的多方安全计算技术,以及联邦学习、数据脱敏、差分隐私和可信计算环境等基于明文的隐私增强技术。

通过隐私计算,理论上可以实现数据可用不可见,用途可控可计量。“数据可用不可见”可防止数据在流通中出现信息泄露,再叠加“用途可控可计量”,就能够保证数据按照事先约定的方法和目的使用,防止滥用。

近几年,金融机构、互联网巨头、数据科技公司等数据使用大户纷纷布局隐私计算。据《财经》记者了解,光大银行即将发布多方安全计算平台;光大科技在隐私计算领域已经有40多项专利申请;华控清交已与多家国有大行和股份行达成技术合作;腾讯、阿里、百度等巨头均发布了自己的隐私计算产品。此外,星云Cluster、富数科技、翼方健数等隐私计算领域的创业公司也先后完成数亿元的融资。

探索:静待启幕

数据要素市场尚未正式启幕,但各方探索已然行动起来。

根据广东省发布的《广东省数据要素市场化配置改革行动方案》,该省提出了五大类共71项改革重点任务,同时给出了较为明确的改革时间表。

到2021年底,初步构建统一协调的公共数据运营管理体系,推动数据新型基础设施、数据运营机构和数据交易场所等核心枢纽建设;到2022年底,初步构建权责清晰的数据要素市场化配置制度规则和组织体系,在数据要素市场流通的运营模式、交易模式、技术支撑、安全保障等方面形成可复制、可推广的经验做法。

《财经》记者多方获悉,当前深圳已经在筹备数据交易所等多项基础设施建设,包括商业银行、数据基础设施供应商等机构参与其中,预计今年底可开始公共数据交易。一位知情人士告诉《财经》记者,深圳当地很重视数据要素市场建设,“他们认为数据要素市场化是改革开放进入第二阶段的标志”。

除地方政府外,金融机构亦在积极探索。

2021年初,光大银行联合德勤发布了《商业银行数据资产估值白皮书》,率先搭建了商业银行数据资产估值体系,同时对数据资产估值体系进行了探讨。上文提到,数据要素市场化三大核心步骤中包括定价,估值是定价的一环。据悉,当前光大银行是少数在数据资产估值方面进行探索的机构。

对于探索动力,王磊直言,商业银行既是数据要素市场的需求方,也是供给方。在需求端,商业银行有大量外部数据采购需求,每年数据采购交易金额过百亿元,整个市场规模上千亿元。以光大银行为例,该行每年从外部采购60余种数据,采购金额近亿元。在供给端,商业银行在业务开展过程中积累了大量数据,将这些数据资产化,在确保安全的基础上对外开展交易,可以释放部分数据价值。“我们发自内心希望数据要素市场做起来,这样无论作为需求方还是供给方,我们都能受益。”

另一方面,数据要素是整个数字经济发展的核心,光大银行希望在这个链条中能发挥前瞻性探索作用。

公开资料显示,建设银行、工商银行、招商银行、交通银行、浦发银行、微众银行等也已在布局,涉及领域包括隐私计算、大数据交易所等。此外,光大科技等金融科技企业,华控清交、路孚特等数据基础设施服务商,腾讯、阿里等互联网巨头,清华、北大等高校,以及北京、贵阳等地的大数据交易所均在积极参与探讨和实践。

值得一提的是,《财经》记者多方获悉,更高层面的指导意见正在酝酿之中,最快将于年内出台。届时,数据要素市场相关概念将被进一步明确。

唐郡/文