文/本刊驻硅谷记者 刘泓君 编辑/谢丽容
当全世界都在关注美国总统特朗普与朝鲜的互怂上,特斯拉创始人伊隆·马斯克(Elon Musk)发Twitter称“如果你不关注人工智能的安全,你应该担心,它比朝鲜问题更危险”。
这已经不是他第一次发表对人工智能安全问题的担忧。8月中,他与来自26个国家的人工智能领袖联合向联合国呼吁严格限制自动化杀人武器,如坦克、无人机自动枪械等,禁止这些武器在国际间使用。
两年以前,马斯克联合硅谷大佬投资10亿美元成立了一家非营利组织Open AI,号称要防止人工智能灭世。
这个组织几乎汇聚了硅谷最有权势与名望的人,除马斯克以外,它包括了很多熟悉的名字:著名孵化器Y Combinator创始人山姆·奥特曼(Sam Altman)以及合伙人Jessica Livingston、前Stripe的CTO格雷格·布劳克曼(Greg Brockman),被称为“硅谷人脉王”的Linkedin联合创始人Reid Hoffman,以及Paypal共同创建者及著名投资人Peter Thiel。
尽管人工智能灭世的言论一直富有争议,马斯克的警告可能并不是危言耸听,但他的Open AI真的有能力有意愿防止人工智能毁灭世界吗?马斯克的真实动机也一直在被质疑。
Open AI的神秘面纱
如果用最通俗易懂的话来解释Open AI正在做的事,就是做一个“会做饭的机器人”。想象一个机器人能够像人一样去行动去思考,这是Open AI的终极使命——建立安全的通用机器人。
做饭是一个非常复杂的任务。尽管现在亚马逊的仓库、特斯拉的工厂中都用上了机器人,但这些机器人只做简单重复性的工作,在车间流水线上组装零件。对灵活的任务,机器人做的并不好。马斯克希望能够通过机器人研究,推进家务机器人的前沿研究。
施天麟是Open AI的早期成员,也是斯坦福人工智能方向的在读博士。2015年12月,他参加一个关于机器人的行业会议,并在这个会议上机缘巧合地认识了格雷格。当时,格雷格开始兴致勃勃地跟施天麟讲未来想要做的事情,并告诉他一些大牛即将加入。在蒙特利尔的一个会议进入尾声时,马斯克与山姆宣布成立新的人工智能非营利公司Open AI。
尽管有着众多的行业大佬背书,实际操作人也起着关键作用。第一个加入Open AI的人是格雷格,相传他与马斯克私交甚笃。他是增强学习很有名的研究者,导师是伯克利做机器人研究的教授。
格雷格创业之后主要负责Stripe底层平台,因此在学术研究社区知名度并不是很高,他主要搭建负责Open AI的基础架构。
真正主管研究的人是Ilya Stuskever,他在谷歌大脑有着三年的研究经验,在此之前,他是斯坦福深度学习实验室吴恩达(Andrew Ng)团队的博士后,曾与多伦多大学教授Geoffrey Hinton一起工作,是其最得意的学生之一。谷歌曾经为了抢夺Geoffrey与他的两个学生,特意发起对DNNResearch的收购,这家公司隶属多伦多大学计算机科学院,只有三个人—— Geoffrey Hinton以及他的研究生学生Alex Krizhevsky和Ilya Sutskever,而且该公司没有任何实际产品与服务。
Open AI成立以后,马斯克每周会来办公室半天。他并不会在会议上滔滔不绝,大多数时候只是听大家说,然后给出一些方向性的建议,在场的成员能明显感觉到他对机器人的浓厚兴趣。
除了给出方向建议,马斯克还会帮Open AI找融资,在现有的10亿美元融资中,有相当一部分来自于他自掏腰包。
山姆则负责Open AI所有的对外合作部分,比如近期跟Dota合作的人机大赛,需要游戏开发者获取他们的API接口以及一些开放数据。
如果要对人工智能研究进行成本分析,成本来自于服务器提供的计算资源、数据获取以及人才工资成本。服务器成本是所有人工智能公司成本中最大的一块,山姆也牵头促成了Open AI与微软云Azure合作,以帮助Open AI寻找可用的服务器。
Open AI目前仅60多人,办公室坐落在Stripe旧金山的办公区。在该组织成立早期,主要依靠内部成员的相互推荐。现在有一套固定的招聘流程招聘研究人员,而基础架构的工程师方向则与Facebook、谷歌的招聘流程类似,招聘工资也直接对标这两家公司。
目前,在Open AI的平台上有三个大的开源平台—— Gym、Universe和Robot。主要研究方向是机器人的迁移学习与增强学习。Gym是指研究在每个细分研究领域建立自己的算法以后,把算法放在不同的环境中测试;Universe目标是让AI智能像人一样使用计算机,目前已有1000种训练环境;而Robot则是训练机器人。
对抗巨头?
马斯克在成立时就宣称Open AI要对抗Facebook、谷歌等巨头垄断,以开源的方式来驱动研究。
就在Open AI宣布成立的一个月以前,互联网巨头把人工智能的发展推向高潮。当时,谷歌宣布将部分开源人工智能引擎,Facebook也在不久后宣布开源深度学习计算机服务器设计。Open AI自成立就开始宣布自己要开放它所有的研究成果。
与巨头开放这些人工智能平台不同,Open AI的开源是算法而非平台,它也会与巨头的开源平台合作,其Gym平台就与谷歌的TensorFlow合作。
回顾人工智能最近几年的发展趋势,无论是算法还是平台,开源已经是人工智能竞争的一大核心策略。
得人才者得人工智能。在硅谷,做深度学习的人工智能博士生,已经成为几大互联网巨头疯抢的对象。各大机构竞相追逐学术研究者并开出高价,这在历史上从没有发生过。一位研究者称:“在Open AI成立之后,谷歌与Facebook给顶级研究人员的Offer高了两倍。”
对学术研究者来说,他们更愿意分享自己的研究成果,并以此建立影响力。开源可以帮助这些AI机构吸引更多的人才。同时,对巨头来说,开源也意味着更多的开发者会利用平台搭建算法,可以帮助平台自我完善,也会加快整个产业的发展进程。
如果要在业内给Open AI找一个对标者,最相似的莫过于与李世石围棋大战的DeepMind。两者都不是平台,而是对人工智能的算法研究。施天麟在他的研究中发现,Open AI更偏向于机器人的研究,会使用更多专门为机器人打造的虚拟环境,而DeepMind更偏向于用游戏做虚拟环境进行训练。
“DeepMind认为在游戏规则下能够获胜的AI有一定智能,但这个离真实的机器人还比较远。你能控制一个游戏机的飞船,并不意味着你真正能够控制一架飞机。”施天麟对《财经》记者说。
他正在为Open AI开发“World of bits”的训练平台,是Open AI Universe的前身,希望机器人能够像人一样在网上订机票、酒店、外卖。但其关注点不是最后机器人如何订到机票,而是通过观察人怎么订机票,让机器去学习人的这种在不同环境下都可以应对自如的“迁移学习”能力。
施天麟认为,尽管DeepMind号称开源,但只开放了几个“迷宫”这类的小游戏,真正核心的算法依然没有开源。
AI竞争,数据为王。无论是Facebook还是谷歌,都有强大的平台资源和数据宝库。外界对Open AI最大的质疑是,没有数据资源如何突破人工智能研究?
吴恩达曾说过:“为什么做AI需要去大公司,因为大公司有海量的数据和强大的计算平台。”
施天麟的项目需要征集人怎么用计算机订票的演示,于是他在亚马逊上发起了众筹项目以征集数据,每小时价格10美元左右,目前已经花了几万美元。但这相对于大公司的数据,依然九牛一毛。
山姆曾在Open AI成立的时候称,Y Combinator将会与Open AI共享数据服务。Y Combinator已经在硅谷投资了大量的独角兽企业,旗下的平台有Airbnb、Dropbox、Stripe。同时,特斯拉也称将开放数据给Open AI,微软与亚马逊也正在变成Open AI的合作伙伴。
如此看来,Open AI可能会通过各种间接渠道获取机器训练数据,但美国对数据监管政策严厉,Open AI目前可以获取一些数据,但这样的来源是不稳定且充满风险的。
不过也有做房产分享的创业者认为,Open AI的房源数据就可以多过谷歌,因此它在一些细分领域并不处于劣势状态,也可能成为对抗巨头的一方势力。
马斯克的私心?
即使对亿万富豪来说,10亿美元的投资也并非一笔小数字。尽管他曾经多次表示出对人工智能心存恐惧,但这一动机仍被质疑。
马斯克曾经投资著名的人工智能研究公司DeepMind,后来这家公司被谷歌收购,这也让他了解了人工智能的发展前沿。接近马斯克的人认为,在创建特斯拉与Space X时,他对工程类技术非常了解,但他并不了解最前沿的深度学习技术,依然处于学习阶段。
眼下,马斯克旗下的特斯拉正在研究无人驾驶,他还将在今年10月推出无人驾驶卡车。在无人驾驶的竞争中,特斯拉每一辆在路上跑的车都可以看成是一次数据收集。然而,无人驾驶涉及到图形图像识别、分析等多个深度学习研究领域,拥有了数据这块宝藏之后,他旗下的公司对AI人才有着迫切的需求。
著名研究员Andrej Kapathy从Open AI跳槽加盟特斯拉无人驾驶团队,直接向马斯克汇报。Kapathy的跳槽让马斯克饱受质疑,外界认为Open AI成为其招揽人才的后花园。
Open AI一个研究项目是机器人如何抓取物体。比如人让机器人去冰箱拿啤酒,啤酒瓶从哪几个点抓起来既稳又不会碎,这个方向不需要大量的数据,只用建立各种模拟场景模拟即可。一个容易联想的事实是,马斯克建立了自己的特斯拉工厂,他的工厂中已经引入很多自动化的机器人生产。
尽管Open AI号称对所有人开放,但这家非营利机构也的确弥补了他商业上的短板,成为这家组织的实际受益者。
在Open AI这种非营利组织架构中,管理较为扁平,以项目为单位划分。Ilya曾经在Open AI的私人聚会上透露,评价标准之一就是发论文。组织成员认为,这种组织形式与大学的实验室比较像,每个人都有自主权去选择要做些什么项目,而科研项目的周期往往比普通项目要长。因此如果实验中,发现想法是不可行的,也可以中途放弃。
不过,这种模式也令外界质疑,类似于学术研究的算法对工业界究竟产生多少影响力有待怀疑。
通常企业开发研究中,不同人会在一个社区中贡献大量的代码,这个代码库由很多程序员来维护。而在学术研究中,只有几个人做一个课题组,很多时候一个人就可以写一个算法。加上学术研究的样本库较小,在大规模的检测后可能并不能应用于其他场景。
除了一些计算机领域的大神,学术研究最终大概只有1%的算法能够适应不同的环境最后留下来。但如果底层研究有突破性进展,将会催生一个产业的诞生。
吴恩达在谷歌大脑时,曾经使用1000台机器去学习Youtube上关于猫的视频,使用深度学习神经网络最后可以在很多图片中识别猫。当时没有人会尝试用1000台机器的大量计算能力去学习。但这次突破印证了当你有足够多的计算资源足够多的数据时,算法的突破会有很大潜力。此后,计算机视觉进入到一个快速发展的时期,人脸识别、图像识别、自动驾驶等基于计算机视觉的公司如雨后春笋般出现。
Open AI的野心是希望能够在机器人领域做出类似的大突破。“如果能把机器人做出来,发明一种新算法让机器在环境中快速学习,极可能催生一个崭新的机器人产业。” 施天麟说道。
不过,机器人通用算法在未来十年里都不会有大突破,因为这需要大量的数据训练、计算能力和高昂的成本投入。
“实现这件事的算法还不成熟,控制人工智能不做危险的事更是无稽之谈。”有不愿具名的分析人士向《财经》记者称,“但是马斯克发表机器人的这些言论是有根据的,如果机器人算法有重大突破,类似于当年识别猫的图片那样,那机器人就是一件很危险的事情。”
不妨这么说,如果马斯克的目标真是通用的人工智能机器人的重大技术突破,那他极可能成为把世界置于危险境地的人。尽管马斯克已经在做尽可能多的增强学习等安全方向的研究,但不排除如果居心叵测之人使用Open AI的研究成果开发武器。
尽管不排除马斯克成立Open AI确实存在一些私心——在未来的技术竞争中占据制高点,并且广泛网罗人才。但他的担忧也不无道理,也可能确实有出于无私的角度在推进行业的发展。毕竟,机器人是个大趋势,巨头与创业公司已经开始抢占市场,非营利组织存在的必要性也毋庸置疑。