我们生活在信息爆炸的年代,信息产生的价值前所未有。
如果对此有所质疑,不妨看看今天全球市值最大的公司前十强,只有沙特阿美石油公司和伯克希尔·哈撒韦两家传统企业,其余八家都与IT信息技术息息相关,其中包括中国的腾讯和阿里巴巴。
如果我们认为市场可以真实地反映一家企业的未来现金流,那么信息或者说数据为何会创造如此大的价值,数据和信息之间的关系到底是怎样的?本文试图回答这些问题。
信息经济学的价值
社会经济问题的核心挑战是克服信息交流的障碍。
人们早就意识到,信息交流在经济活动中的作用不可代替。经济学家哈耶克对此提出了两个关键论点:第一,不像普通的有形商品,做决策所需要的信息往往没有具体的存在形式,而且分散在各处,需要进一步生产和提炼;第二,为利用好分散的信息,社会面临最重要的经济问题,实质上是如何促进信息的收集和交流。
这听起来像是简单的常识。但由于近些年隐私泄露、身份盗窃和网络犯罪屡见不鲜,人们关注的焦点往往集中在个人信息交换的负面影响上,而忽略了常识。我们不应忘记,信息分享不仅给每个人带来了福利,对整个社会的进步更是至关重要。
开创性的经济研究——信息经济学出现于20世纪70年代和80年代。最主要的发现之一是,有限信息和不对称信息会阻碍市场有效率地配置商品和服务,阻碍自愿和互利的贸易,并导致市场失灵,扭曲投资和消费决策。最著名的信息失衡理论应该是诺奖得主阿克尔洛夫的柠檬市场现象:即消费者和生产者信息不对称,消费者缺乏对产品的信息和信任,只愿意选择低价产品,从而劣币驱逐良币,赶走了好的服务商(桃子),只剩下质量不好的“柠檬”,随之恶性循环,直到整个市场消失。
印证这一理论最典型的例子是二手车市场,由于消费者难以获得关于车况的信息,导致二手车交易难以规模化,最近优信、人人车等平台折戟沉沙,凸显了不对称信息对市场的破坏性。
信息经济学通过巧妙的市场设计和工具,能够在一定程度上缓解信息不对称所带来的效率扭曲。这些工具包括诺奖得主斯宾塞著名的信号理论——名牌大学毕业证是就业市场中的信号,以及筛选理论和以诺奖得主马斯金为代表的机制设计理论。
从信息经济学到数据经济学
20世纪40年代,克劳德·香农和阿兰·图灵的天才创想,将数据编码于“数字原子”中——今天被称为比特。自此,数据可以被数字化,现代信息科学就此滥觞。再加上新兴的半导体技术被大规模用于数据计算和储存,推动了数据的爆炸式增长。今天数据生成和流动的速度之快,在过去很难想象。比如,一条消息在推特上发布后,立即会被记录在推特的数据架构中,并在几微秒后发布到用户的时间轴上。全世界成千上万的用户在推特上发布信息,从而产生了不间断的海量实时数据流。大数据的这种“速度”,意味着信息实时生产和分享的数量之多和维度之广。
数字革命让信息得以通过数字化的形式采集、存储、处理和传递,人类获取和使用信息并从中获益变得前所未有的简单,这就是为什么数据日益成为重要生产要素的原因。
然而,数字革命并未改变信息在经济活动中发挥作用的方式。大数据时代,社会面临的最重要的经济问题,仍然是如何通过数据的流通,更高效地利用分散的信息,从而促进信息的收集和交流。从这个意义上看,数据经济学就是21世纪的信息经济学。通过数据的流通,实现经济活动中更高效的信息交流,是数据能发挥价值的根本原因。
应该注意的是,这并不意味着数据等同于信息。数据只是信息的载体,从原始数据到有价值的信息,其中还要经历一个漫长的收集、分类、压缩、存储、分析和使用的过程。密码学通过加密算法将信息深埋在数据中,这正是利用了数据和信息之间的巨大鸿沟。虽然数据本身可以被“公开”,并因此可免费获得,但只有拥有加密“密钥”的人才能够从中提取有效信息。图中的“知识金字塔”比较直观地展示了数据与信息的关系,它描述了人类如何从客观世界的观察中获得数据、逐步提炼信息、获取知识和智慧,并进一步运用智慧来改造现实世界。
数据的价值从何而来
在数字时代,数据的作用日益凸显,然而,这并未改变数据是通过流通促进信息交流的本质。大数据的巨大价值,不在于数据量的积累,而在于通过高频(甚至实时)、海量、多维的数据交互,从连接、决策和信任三个方面,提高了经济协同的广度和深度。如果说数字技术革命是一场信息革命,那么信息交互的广度、深度和频次提高的幅度,则决定了数字技术革命在多大程度上可以推动社会进步。
第一,连接的数字化,降低了众多消费者和生产者之间彼此建立连接、有效沟通信息的成本,从而让社会分工和协作的普惠性参与达到前所未有的水平。
一方面,信息被数字化以后,流通效率大幅提升,成本大幅下降,让消费者和生产者的沟通突破了传统时空的约束,可以实时地连接远隔千里的用户,创造大量新的消费和商业可能性,拓展了市场的边界。传统线下交易的特征一般可以用经济学中的“重力模型”来描述,即本地商户的用户绝大多数来自方圆10公里范围内,距离越远,交易越少。而在网络购物平台上,买卖双方的距离可以超越数千公里,通过文字、语音、图片甚至直播视频的方式,实时沟通商品的功能、外观、价格等一系列交易所需要的信息。
另一方面,大数据的意义不仅在于提供低成本的信息交互,更重要的是提供对用户有价值的信息,为买卖双方建立牵线搭桥的有效机制。如果说传统市场的主要障碍是缺乏信息,那么数字时代的新障碍就是信息太多——信息超载。消费者有数十亿种商品和服务可供选择,生产者或卖家面临数以亿计的潜在客户,双方都难以通过简单的浏览和搜索找到合适的交易对象。因此,通过使用个人大数据,基于消费者的购买历史、搜索行为和个人特征的算法推荐系统,来提高消费者和商品的匹配效率,已成为各大网络购物平台的基础配置。罗汉堂对超过62万名淘宝用户进行了大规模的匿名随机试验发现,在算法推荐中不使用个人数据时,只有头部商品能得到曝光,消费者可供选择的产品品类减少,参与度大大降低,导致点击率下降77%,交易下降高达81%。
第二,决策的数字化,降低了生产者了解客户、市场和自身经营状况等重要信息的成本,能更高效、快捷、准确地做出客户导向的决策,这对中小微企业的作用尤其重大。
一方面,数字化的决策,让中小微企业能够及时获取有效信息,提升自身经营效率。过去,只有大型公司才能负担专业的市场调查、分析、客户关系维护的成本,而在数字时代,淘宝、京东、亚马逊、拼多多等电商平台都面向普通网店店主,并能提供更及时、更多维、更准确的信息分析工具。
另一方面,传统的企业贷款要了解客户,只能通过公司财务数据、线下调查,并主要依赖抵押担保,因此往往只能局限于大公司。而大数据可以被用于判断信贷风险,辅助放贷决策,让中小微企业的经营状况和信贷风险评估的成本降低、准确度提升,缓解了它们的资金压力,消除了普惠金融的重大障碍。
第三,通过低成本的共享和公开众多交易的历史、评价等信息,建立起数字化的信任,提高了买卖双方负面交易行为的代价,从而降低了双方互信的成本。对于运营在线市场而言,对产品和其他参与者的信任是交易的必要条件。正是通过数以亿计的用户自发地对每一个商家、商品和服务评分,给后续的消费者提供公开的参考标准,提高了不诚信商业行为的代价,才建立了商品、服务和商家的信任机制,让在线市场能像线下交易面对面进行交易一样,保障市场的正常运转。
实践已经证明,只有了解了数据产生价值的原理,人们才会更深刻地理解目前对数据问题的一些争议和讨论,例如如何保护消费者的数据隐私、数据的权属问题以及数据与市场竞争等等。
(陈龙为罗汉堂总裁、罗璇为罗汉堂经济学家,本文核心研究思想来自罗汉堂近期发布的《理解大数据:数字时代数据与隐私》报告;编辑:朱弢)