“要么率先燎原,要么最先熄灭。”这个略显悲壮的口号一直被挂在位于安徽合肥科大讯飞公司的办公楼外。也定格了智能语音交互技术在近十余年内的坎坷经历。
41岁的科大讯飞董事长刘庆峰已经很久没有抬头看这行字,自今年初制定了由B2B战略转型B2B2C战略之后,他更忙了。
十余年来,智能语音一直无法摆脱“玩具”的清冷形象,没人否认这个技术的先进性,但如何利用这个技术赚钱,也没有人能想清楚。
科大讯飞发轫于中国科技大学,1999年创业,一直到2004年才实现盈亏平衡。其创始人刘庆峰在创业之初认为很快就可以做到100亿元,很快就能上市,事实上科大讯飞2008年上市时,才做到1亿多元的年销售收入。整个过程充满艰辛。
以2009年中国正式商用3G为转折点,科大讯飞从谷底爬升。时至今日,已经在机器合成语音市场占到了70%以上的份额。2013年,讯飞营收为12.5亿元,这个数字比2012年增长60%。
有研究机构预测,智能语音的市场容量至少超过30亿美元。和千亿美元的市场相比,这只能算是一个小市场。但鉴于物联网和可穿戴设备的广阔前景,智能语音的入口级意义更为可观。
这被刘庆峰视作一个好机会。与其继续在后台为其他公司作嫁衣裳,不如自己卷袖单干,直接做终端消费者的生意。
刘庆峰选择以智能家居为突破口。他希望推动一场“从手控到声控”的智能家居变革,通过发出语音指令来实现开灯、调光,开关电视、空调等智能家电的动作,进而实现整个家庭的智能交互。
刘庆峰画了一个饼。这个饼能帮助讯飞突破市场限制,做更大的生意,但风险也是可估的。科大讯飞开始了二次创业。
跋涉商业模式
在市场几度变化沉浮之后,讯飞才最终找到一个适合自己的节奏。
智能语音技术原理复杂,技术开发周期长、投入大,进入壁垒很高。在全球范围内,目前已形成寡头垄断竞争格局,仅有Nuance、IBM、微软、Google、科大讯飞等少数厂商具备较强竞争力。
我国语音技术厂商基本分为三类:一是传统语音技术厂商,包括科大讯飞、捷通华声;第二类是互联网厂商,包括百度、腾讯、搜狗等,普遍采用战略合作或者收购等方式,掌握智能语音技术,推广语音服务;第三类是创业企业,像云知声、思必驰等,它们专注于某些行业领域如汽车、家电,推广自己的语音技术和产品。
科大讯飞几乎是智能语音领域起步最早,目前也是唯一能够与国际巨头抗衡的公司。而在长达15年的时间里,这家公司曾经一度找不到方向。
1999年底,融资3000万元之后,科大讯飞成立,公司有两个目标,一个是做全球最大的中文语音技术提供商,二是做全球最出色的多语种语音技术提供商。
刘庆峰觉得市场空间很大,马上就能做到。但在接下来的几年里,他备受煎熬,“这个东西很好,技术也在不断提高,但不知道从哪把钱挣回来。”
当时,IBM、微软等国际大公司虽然都把智能语音业务当作未来的潜力业务,但他们都只是布局,并不抱挣钱的念头。
而刘庆峰期望更大,第二年就推出面向消费市场的话王98和畅言2000等两款产品,用以帮助一些特殊人群操作电脑。当时,立下了创造100亿元营收的目标。但因技术障碍和高昂的终端维护成本,这两个产品最终失败。
这与当时的产业发展环境有极大关系。当时,中国无线网络仍在2G时代,除了客服中心和视力残疾的特殊人群,语音识别技术过于超前,应用环境根本不存在,那些看上去很好的功能都是摆设。
亏损烧钱的状态让刘庆峰每晚失眠,核心技术人员怨声载道,投资人联想之星的财务总监甚至当场在业绩会议上流下眼泪。
那次失败让刘庆峰意识到,一个十几个人的创业团队做消费者市场过于理想化,他转而做B2B市场,带着团队找了联想、华为,劝说他们把讯飞的技术推广到联想的笔记本和华为的呼叫中心上。
他回忆,那是一个不断“推”和“磨”的过程,要说服这些大厂商去用,但最终还是用户说好才管用,因此需要做出多种应用去引导用户。通过这种方式,讯飞的收入从一个月十几二十几万元,生生到几十万、一两百万元。
直到2004年,讯飞实现盈亏平衡。此后,在技术和市场两方面,讯飞都开始爬坡。2008年上市,讯飞的年销售收入达近2亿多元。后得益于移动互联网的迅猛发展,讯飞长期的技术积累也得以发挥,最好的时候,中国十大IT电子公司中,有八家是采用讯飞的语音交互技术方案。
但这仍然无法与其他走在前列的巨头相抗衡。苹果的Siri已经广为人知,谷歌“OK Google”的语音控制命令也很抢眼,微软则在实时翻译领域占据主导地位。
经过多年积累,语音交互技术最终成为了上述巨头旗下的一个重要应用分支,成为它们在生态系统布局上的一个得力工具。得益于平台,这些语音交互技术可以产品的方式直面消费者。而讯飞则久久止步于B2B市场领域。
资深业内人士陈志刚向《财经》记者表示,智能语音服务只是一个依附性的产品,必须依靠别的产品而存在,就像猪和毛的关系。
走向应用前台
今年9月,科大讯飞轮值CEO吴晓如告诉《财经》记者,讯飞语音助手APP“灵犀”的用户已经超过了1.6亿。其中,运营商商店下载和第三方应用商店用户量各占一半。
刘庆峰称,灵犀输入法的用户远远超过百度和搜狗,甚至超过了后二者的总和。但这个很牛的APP至今无法为科大讯飞带来营收和利润。
目前,给讯飞带来收入的业务有四大块,分别是在线教育、企业智能客服、车联网及运营商。其中,在线教育能带来超过30%的收入,其他业务分别在20%上下。
在线教育,包括各种语言类在线考试,例如全国30省的全国普通话等级考试,唯一使用的操作系统就是科大讯飞。这一方面由于科大讯飞拥有业界较高水平的智能语音技术,另一方面具备中国科大背景、国家863计划攻坚组核心成员的身份也起了直接作用。
刘庆峰认为,尽快占据手机端入口和电视端入口是当务之急,也是讯飞转型的关键所在。今年8月,讯飞宣布进军智能家居产业,讯飞发布了面向智能家庭领域的系列语音产品,包括新版本语音助手灵犀3.0、以语音交互为特色的讯飞智能音箱、面向智能电视交互的“未来遥控”。
在规划中,这是一场“从手控到声控”的智能家居变革,通过发出语音指令实现开灯、调光,开关电视、空调等智能家电的动作,进而实现整个家庭的智能交互。
具体思路是,软件和硬件双管齐下,软件方面,以电视机为切入口,首先与七家电视机厂商合作推出智能电视的“未来遥控”方案。硬件方面,则与中国移动联合推出智能硬件产品——讯飞智能音箱,其卖点是实现语音、哼唱和原声搜索“三合一”功能,背后依靠中国移动的无线音乐基地大量的正版音乐资源。
刘庆峰看上了移动互联网入口带来的大生意。为了用最快的速度占领智能语音市场,形成一个良性生态系统,讯飞2010年发布语音云平台,这个平台的合作伙伴已超过4万家,包括腾讯QQ、新浪微博、58同城、高德地图等各类主流应用,支撑用户数百万级以上应用超过1000多个,终端用户数量超5亿。
国内最早进入智能家居行业的集成服务商Broadlink创始人刘宗孺在接受专业媒体采访时认为,国内的智能家居目前大部分还只是噱头,因为家电单品之间的智能标准尚未统一,无法互联互通。
讯飞希望自己是这样的一个连接者。也就是说,通过手机讯飞客户端控制你家里的电视、空调和电灯。但在最近的一段时间里,你需要购买和讯飞合作的家电品牌的产品,且大多是几个有限的型号。
刘庆峰对此并不悲观,他预计,今年底语音联盟的大会,就会有新的标准制定出来。
最终,讯飞不再是一个只为大公司提供语音解决方案为生的公司,而是一个以基于云计算的智能语音服务为切入口,成为一个语音平台公司。
虽然人们普遍认可家庭娱乐中心将成为继移动互联网之后的又一个蓝海产业,但这个市场多年来始终没有市场之王的候选人。从互联网公司到IT公司再到传统的家电厂商,涉足这个产业的公司既合纵连横又分别竞争,一时显得有些混乱。苹果TV的迟迟不能问世,也在一定程度上说明了这个市场的不易和复杂性。
对于急于进入这个市场而又手握一定筹码的科大讯飞来说,这是机会,也是风险。
刘庆峰的决策团队意识到了这一点,在进入新的消费市场的同时,他并未放弃在现金牛市场的努力。最近,刘庆峰接待了多批教育市场的客户。
科大讯飞在车联网市场的领先优势继续扩大。在德国奔驰汽车去年8月组织的一场车内智能语音比赛中,讯飞是唯一在时速100公里之上还可以使用的解决方案。这也直接促成了讯飞和奔驰的合作,并带来了宝马、沃尔沃、一汽、上汽、江淮和奇瑞的订单。
可能的挑战
刘庆峰承认,手机端的入口已经被谷歌和苹果、百度和腾讯这样的平台型公司所占领,但他依然认为,还有三分之一的手机入口留给手机厂商和讯飞这样拥有技术优势的公司。他想在这其中拿下最大一块。
他的预期也比外界对智能语音的市场预期要乐观很多。他说,15年前立下的年营收100亿元目标,很有可能在未来几年实现,但一些公开分析机构的预测是,这个市场在未来数年的总市场容量约为30亿美元。
互联网的成长速度十分迅速,9月底,中兴通讯、Nuance、Audience、高德、百度、中国科学院自动化所等公司和机构宣布成立“智慧语音联盟”,并发布了第一个中国智能语音技术规范标准“5A标准”。
这意味着,随着智能语音技术前景的不断放大,技术的快速成熟,科大讯飞面临的潜在竞争对手正越来越多,这些单个语音实力远不如讯飞的中外公司,正在抱团取暖。以前科大讯飞是摸着石头过河,现在则是丛林中行走。
讯飞还要面临技术门槛带来的用户教育成本。包括灵犀在内,任何一款语音识别软件都需要大量的训练以便识别用户的语音特征,来提高准确性。但又有多少人会天天对着一台手机喃喃自语呢?
更大的挑战来自内部。吴晓如承认,讯飞从B2B走向B2C,不仅在产品研发管理、把握市场需求方面存在新挑战,业务模式也需要进行巨大变革。
在直面移动互联网用户之后,讯飞不仅需要加快产品迭代周期,用户需求复杂度更是成几何级增加,做到这两点已经十分不易,更何况讯飞是一家技术研发型公司,2500人的总员工数中,超过1800人是技术工程师,渠道布局和市场营销并非其所擅长。
科大讯飞在人工智能上的科学探索已经延伸到声纹和人脸识别、语言翻译等领域,其“超脑计划”甚至试图建立认知计算引擎,让机器模拟人脑的知识表示和学习过程,从而实现机器从“能听会说”到“能理解会思考”。
整个讯飞团队都笃信其技术能力即将创造新一轮神奇,但它所面对的挑战又是十分具象的。正如吴军在《浪潮之巅》一书中写道,所有成功的大公司都有好的商业模式,诸多案例表明,很多大公司的兴起,不是靠技术,而是靠商业模式的转变。