大数据功能之辩

2015-06-15 16:44:00

陈彩虹/文

大数据时代已经到来。与以往工具性革命不同的是,很多理解大数据的书籍或文章,都在表达同样一种观点:大数据大有取代人类的组织、制度,甚至道德、价值观和宗教信仰的超常力量。大数据,已经全然成为主体或主宰的角色。“除了上帝,任何人都必须用数据来说话”,成为对大数据神奇功能的最经典表达。在这里,人,已经退居于次位了。

那么,大数据究竟是人类的工具,还是主宰?如果只是工具,我们只需要回答工具运用的利弊和风险;但如果超出了工具的范畴,整个人类社会便都在大数据的幽灵管控之下,那将是什么样的场景?

大数据未必万能

记得有这样的说法,历史是不可能的。意思是说,人类社会要将自身全部的历史真实地记录下来,没有可能性。这是因为,每个人都是人类的一部分,每个人每分每秒的活动,都是人类历史的一部分,当且仅当这些活动被完整地记录时,人类真正的历史才得以存在下来。

经验告诉我们,管理是不可能的。现代社会,将一个组织内部自然分裂为了管理者和被管理者。不论管理者使用何种监督、管理、控制、激励、评估和考核等方法,他根本不可能使被管理者每分每秒都严格服从管理者的要求。因为管理者根本不可能完全掌握被管理者每分每秒的活动情况。

历史和管理不可能,预测未来就更不可能了。明天股票市场的走势如何?2016年巴西奥运会上哪支队伍将问顶足球冠军?谁将赢得下一届美国总统的选举?尽管人们乐此不疲地预测这、预测那,用尽了参数、算法、模型,最后却从未有过“一致的”预测结论。就是“预测准确”者,事实证明也大多不过是运气加猜测。

就在我们将如此“不可能”演进到更为广泛的领域时,大数据来了。

所谓大数据,核心就是“量大”,或称全量数据。既然全量,数据就是混杂的,不精确也不需要精确,有可计量和可计算的,也有不可计量和不可计算的。正因为如此,以往关于数据之间的“因果关系”,在大数据时代就只存在“相互关系”了——你不需要由部分去推测全部,全部都可视或都可掌握。

举例说,当年泰坦尼克号撞上了冰山,船长能够看到的,只是冰山一角;他只能通过这一角冰体,去推测整个冰山大小,建立海面上可见部分和海里不可见部分之间的“因果关联”。如此认知冰山,具有极大的盲目性。结果,悲剧发生了。

如果能够掌握整个冰山大小和运动的全部状况,船长就将避开冰山。冰山大数据在此给予船长决策的信息,完备到了没有丝毫的遗漏,不需要任何的推测,当然就不需要任何的参数、算法和模型了。可见的一切,决定了可控的完美。

但是,人类有如此的可能,记录和保存下来全部关于自然和人类社会的大数据吗?

我们注意到,许多学者对于巨量的现代信息记录和储存有足够的信心。特别是,对于人类活动所有信息的自动记录,以传感器为代表的科技手段显示出了强大的功效;甚至于,关于人类大脑记忆、思维活动和逻辑预测,这些看不见的存在,随着脑科学和信息科学的进一步的发展,也将被全部记录、可视化以及可掌握。大数据就将是“大全”无疑了。

这样,我在此时的写作,很可能就被身边无所不在的传感器所记录,并传递到某个存储中心。相应而来的,就是管理者能够十分清楚被管理者分分秒秒的言行,管理轻车熟路。至于预测未来,再也不能称之为“预测”,因为将要发生和出现的事项,由于自然和人类社会的全量数据,包括人们脑子里想要做的,都已经确定存在了。你要问明天的股市走势?好,所有投资者的想法都已经被清楚掌握,是涨是跌完全确定。

这与其说是预测明天,不如说是今天决定明天。

这是一幅奇妙诱人的画卷。然而,基于它人类生活逻辑的缺失,我们只能认为这是现代人类思维创造出来的新型“乌托邦”。或者至少,这个问题的答案是不确定的。这正如地球资源无法支持无限扩展的人类数量一样。再大的大数据,也无法尽收自然和人类社会全部的存在和活动内容。

更为重要的在于,大数据不可能仅仅由机器设备自身运转来实现其功效,总是要有人的介入或至少是协调,抑或是管控。人的非机器属性,决定了有人在的大数据必定有不确定的“人为”因素。管理也好,预测也罢,依据于“人在”的不确定数据,就难得有完全正确并精确的管理方略,更谈不上将明天未定的格局确定在今天了。

如果人类被大数据主宰

与他种工具相比较,由于不断进步的储存、移动和网络技术,大数据工具很容易被提升到更高层级,大有“超级工具”的意味。这种进阶,常常让人们的思维走得更远,大数据似乎有对其他工具的取代功能,甚至有超越工具的功能。

从人类社会发展史来看,技术、制度(包括组织和规则)和道德理念(或文化价值意识形态)是三个不可或缺又不可相互替代的社会要素。这三种要素,都是由人类自我创造、变革和积累起来的。相对于人的主体地位,它们都是工具性质的,是从属性的存在。当技术进阶特别是出现突变时,既存的制度和道德理念就将受到巨大的冲击,从而产生制度和道德理念变革的需要。通常的结果是,基于技术进阶的直观、直接进步性,适应性的新制度和道德理念就将逐渐形成,一个新的技术、制度和道德融合的时代到来。

有点可悲的是,人们常常忽略了另外的一面:技术进阶或变化并非必定、长久和全面地意味着人类社会的进步,制度和道德要素经常会反过来,抑制、协调甚至取消某些技术的进阶。在这种意义上,可以说,几千年的人类文明史,就是这样“三大要素”不断变化、影响和组合的历史。

时下关于大数据作用的突出化或神化意味,是相当浓厚的。笃信大数据这个新鲜的造物,不只是一种新的技术工具,更有那跨越疆界,取制度和道德意识而代之的功用。如此逻辑再往前走一步,那就是取代人的主体地位了——大数据时代的全面到来,人的主体地位终结。

达到巅峰的大数据逻辑

当大数据大到完全无遗漏地记录人类社会所有的个体、在所有地方和所有时间里的言行,并可以自动分析和掌握所有个体的言行规律、习惯,甚至偶然的例外时,每一个人便都被完全地“数据化”了,以往定义的“自然人”、“经济人”等,就被“数据人”所替代;同时,储存、传递和使用数据的技术手段日新月异,数据越来越失去其私密控制的可能,每个人不只是“数据化”,还被“透明化”。

例如,现在的“人肉搜索”,未来就会为“透明人展示”所取代。大数据能够达到的巅峰,就是如此“透明数据人”的出现。这意味着什么呢?

当你清楚,在通过路口时,你的言行都被“探头”等工具“数据化”而完全“透明”在公众面前时,你便会自动地服从路口通行的规则。所有通行者都是如此时,路口便展示出机器对于人的管控特征来:人人都听机器的。人在此时,似乎不再自我、自在和自由,只有对于机器设定流程和技术标准的完全、绝对和终极服从。如果有“出格”言行,因“数据”完整,又透明公开,你将受到惩罚。可见,“透明数据人”的第一意味,就是服从机器或是技术工具。人,屈从在自己的创造物面前。

进一步看,基于全量数据和全透明,人性中的三大“恶”,即贪婪、懒惰和恐惧,就会受到极端性的抑制,甚至被消灭。既然你的一切都“数据”和“透明”,那些“见不得人”的东西,就不会让其见人了。人皆如此,这个世界就不仅没有见不得人的东西,连相关的想法都没有了,人性里的“恶”就此消失殆尽。那是一个多么简单和谐的世界!

与“恶”相对应的,是人性中的同情、怜悯、关爱等“善”。当“恶”消失时,“善”因为缺乏“恶”的对比,自然地平常化,其“善”的程度也必定日益淡化,最后成为日常言行而社会性地被漠视,至少不会被突出、敬重和褒扬。这样的“善”,与其说是“善”,不如说是常态之为更贴切。“善”一旦成为常态,便不需要张扬、鼓励和推动。在这一点上看,人性实则已无善恶,事物完全舍去是非。

再往前行,组织、制度、道德和价值观,还有宗教理念等,这些基于人性的“善恶”复杂结构而形成的社会历史形态,就没有必要存在。当路口人人都基于大数据而完全无误地遵循规则通行时,监督的交警和处罚或褒奖的机构都是不必要的,相应的制度也显得多余。就是那些所谓的道德要求和理念,大数据加以透明化,人们不再以道德的良好感知为驱动去守则,守则成了固化行为,道德等意识形态类的东西还能够存在吗?

人之所以为人,在于人性有别于世间他类存在物的本质。这一点表明,人性不可能更改,人的主体性也不会改变的。

虽然如此,人类历史的经历表明,人性和人的主体性是一直受到自然、人类社会自身和人的创造物的限制、冲击和挑战的,不时的、局部的人性丧失和主体性疑惑与徘徊,都是存在的。在人类社会思想和实践的长河里,人性和人的主体性一直都处在存在和反存在的对抗之中。在这种存在和反存在的过程中,保有人性和人的主体性,就是人类的基本使命。在我看来,这一使命,至今未见得有丝毫的变化。

大数据,这个人类最新的大创造,无论如何看待它的巨大功用,它与货币类创造,没有什么不同,也只是一种人类的造物。既然只是为人使用的技术工具,就不应当成为统治人的主体,事实上也成不了统治主体。

避免大数据霸权

大数据当然是有用的工具。虽然说,它并不可能让“历史可能”,却的确让“许多的历史成为可能”,也的确让“许多的管理成为可能”,并大大地提高了预测未来的水准。

同样,大数据并不可能消除“因果分析方法”,但的确省略了大量的因果分析,还为复杂的因果分析提供了厚实的基础。重要的是,许多自然、社会和经济等风险,通过大数据,可以得到更为确定的掌控。在这个意义上讲,大数据时代里,不会很好运用它的个人,必定落后;不会很好运用它的机构,必定会被淘汰;而不会很好运用它的国家或民族,将必定处处被动。

但再有用的工具,也只是工具。应当清楚,作为工具的大数据,自身并无所谓利弊。它的利弊,完全产生于人们对它的认知和使用。在这里,认知是第一位的——正确或说有利地使用它,取决于明确、客观的认知。

这一认知的价值,表现在重申人的主体性,和人性本质的顽固上。或者说,只有人,才是“万能的”。共同服务于人类社会还需要其他的工具,如组织、制度、道德和信仰等,都是服务于人的工具,大数据只是“工具箱”中的一种,它并没有对于其他工具的取代功能。时下对于大数据功能过大的渲染,大有培育和强化一种“大数据霸权”或“技术霸权”理念的味道,推崇技术至上的社会生存和生活模式,淡漠并弱化社会组织、制度、法律、道德等他类工具,使得社会各种管理畸重于技术工具。

“技术霸权”会带来什么

一方面,“技术霸权”强烈地忽略人的主体性,忽略人的主体性对于自我人性中“恶”的抑制,必将加大社会问题的冲突程度,加大社会管理成本,甚至引发巨大的社会对抗。当技术至上成为社会普遍的行为驱动意识时,人们就都会以追求技术工具的执掌和使用为常态,淡化人自我的内心约束。

一旦人性中的“恶”没有了自我主体性的抑制,如法律意识的内化、道德感觉和信仰要求,技术工具竞争和对抗中的人性“恶”就将极端化,进而逼迫更为强大的技术工具出现、争夺和争斗,社会问题更趋严重,管理难度和成本巨量增加。如当下网络世界里的病毒和反病毒,信息的盗窃和反盗窃,就是“技术霸权”问题最为生动的例子。

另一方面,“技术霸权”下对于其他工具的漠视和削弱,加重了人性“恶”的放纵。包括技术工具在内的“工具箱”,虽然都是由人自我创造出来的,但它们对于人性中的“恶”是有一定的外在抑制力的。有些工具,还是就人性之“恶”而创设出来的。大数据基于它“全量”加“透明”,有助于扬善止恶。

然而,单一的技术工具,根本无法发出较为理想的抑制作用。这是因为,“技术霸权”理念的普遍化,使得人们相信,技术工具的抑制,一定会有相应的反抑制技术工具出现;与此同时,制度和道德等工具的失位,让这种技术性反抑制能够轻而易举地实现。当行车人用高新技术手段遮住了车牌,让“探头”照不到时,其违规行为就有了“道高一尺,魔高一丈”的意味,而制度处罚和道德谴责的空缺,无疑会助长人们与“探头”对抗的“恶”行。

令人担忧的是,大数据正在向如此的“技术霸权”行进,懂它和不懂它的人们,都在试图“抢占”大数据的制高点,努力去获得那种技术神奇。

当然,现实也在给予我们明确的警示。人们不仅发现,真正完全无漏的“全量数据”根本无法获取,也就无法由其来掌控外部世界,更无法用“确定”代替预测;而且发现,谁来使用大数据,成了最为关键的问题。

这如同当年居里夫人发现了镭一样,使用者的不同,决定了对人类意义的完全不同,或是用镭治疗人类疾病,或是用镭制造杀人武器。这也如同在“伊卡洛斯悲剧”里,儿子和父亲使用人造双翼飞行的结果不同一样。

说到这里,我们又回到人的主体性。镭也好,人造双翼也罢,还有大数据,最终决定它们“能”和“不能”、“如何能”又“如何不能”的根本的因素,是人,而不是这些被发现、创造或是积累的外在物自身。

在这个变化无穷的世界里,人类不可能不会迷茫,有时甚至是会迷失的,但时刻记住人的主体性,认清大数据类工具的属性,我们就不会“迷”得过久、过深。

我想在此推荐英国学者维克托·迈尔-舍恩伯格等著的《大数据时代》一书。作者在预言大数据带来巨大冲击的同时,敏锐地提示了过于依赖大数据,将对人的主体性造成伤害。

希腊神话中有一个“伊卡洛斯悲剧”,仿佛就是人类被机器俘获的写照。一位叫伊卡洛斯的孩子,用羽毛和蜡制造的双翼飞行时,没有听从父亲代达罗斯的警示,过于相信双翼,越飞越高,结果蜡被太阳融化,双翼脱落,坠海身亡。就这一点,称维克托·迈尔·舍恩伯格为大数据时代的“代达罗斯”,应不为过。

作者任职于中国建设银行总行

功能 数据