移动互联网时代,语音输入几乎已经成为人们玩手机的标配,而这背后,一个公司的名字总是无法绕过,那就是科大讯飞。截至2019年5月31日,讯飞开放平台开发者总量103万,总应用数64万,累计终端用户数23.9亿,而这些数字也每天都在迅速增长。可以说,在智能时代,科大讯飞就是一面中国语音智能的旗帜。
而很多人不知道的是,在迎来今天的辉煌成就之前,科大讯飞已经在这个领域深耕了20年。回溯科大讯飞刚刚成立的年代,在“互联网“这个名词都甚少提及的年代,我们可以想象得出选择“人工智能”这个超前领域研究的艰苦和困难。支撑着讯飞人拼搏二十年的精神,恐怕才是科大讯飞20年来最大的财富。
披荆斩棘,直面全球竞争
科大讯飞成立于1999年的合肥,在这个阶段,如果说有什么词特别符合科大讯飞,那恐怕就是山穷水尽了。对于创始人刘庆峰来说,在这个年代就放弃去美国拿奖学金深造的机会和去微软工作的机会来创业,显然是一个非常激进的选择。毕竟那个时代不管是外部环境还是内部机遇,都并非最佳节点,而选择智能语音这条道路又是难中之难。因为就算是全球在这个领域也都是刚刚开始探索,并且并没有什么成熟的路径可以参考到中文的识别上。
而事实上,在1999年开始创业后,到了2000年秋冬,科大讯飞就面临着要不要继续干下去的重要抉择了。这一年,创始人刘庆峰带着科大讯飞最开始的近20名干将在巢湖半汤温泉开了一场在讯飞历史上举足轻重的“半汤会议”,经过两天的艰苦抉择,确定了继续做语音的道路不动摇。“燃烧最亮的火把,要么率先燎原,要么最先熄灭”,这是刘庆峰在当年的年度大会上说的话,这句话至今仍被挂在讯飞大厦的墙上,近二十年来,激励着每个讯飞人在智能语音与人工智能道路上不忘初心,坚守前行。
当然选择这条道路和刘庆峰本人的擅长领域也有关系。当时刘庆峰担任福建中银集团与中科大建立的联合实验室、中文语音合成第一个产业化的实体中银天鹰智能多媒体实验室的总工程师,在语音研究方面还是有很多技术成就。但就是因为整个智能语音技术尚出于早期阶段,所以相关行业在语音应用方面还有很多分歧。当时的行业应用重点还是在语音合成上,换句话说,就类似语音客服,能够把文字信息变成语音读出来。而在语音识别方面,尤其是中文语音识别方面,还缺乏突破。而在这个时候,科大讯飞已经做出了第一个商业化的语音识别系统产品,也因为太早期市场规模未打开、定价较高以及市场山寨产品低价恶意竞争等元素,惨遭失利,这也让科大讯飞再次陷入财政危机之中。
而之后,科大讯飞一方面通过各种融资来解决资金问题,另一方面则通过企业服务解决收入问题,2007年 营收就突破了2亿元,并在2008年顺利上市,成为了中国第一个由在校大学生创业的上市公司,也从此成为了中国智能语音行业的标杆企业,也是科大讯飞获得成功的第一个阶段。
提前布局AI生态
在2010年,整个智能语音行业进入了一个重要的转折点,那就是打破之前的识别模型,抛弃传统的用英语的40个左右的基本音素建模的方法开始引入神经网络开始进行深度学习,用今天的话说,就是人工智能。这大大提升了语音识别的能力,也可以说开启了人工智能的全新时代,而一般意义上的人工智能可能还是要等2016年阿尔法狗战胜李世石的时候,才真正被大众所熟知。而科大讯飞则早早的开始了AI生态的搭建,成功的从智能语音开始向人工智能转变。在这个阶段,越来越多的巨头开始进入人工智能领域进行发展,包括智能音箱、机器人之类的应用,也开始百花齐放。不过我们必须要说,基于科大讯飞技术的识别服务还是最稳的,从音箱,翻译机到录音笔等,每一样产品,都开创了该品类产品先河。
在这几年里,讯飞基本成为了语音输入的代名词,而且在大家第一次使用这个语音输入的时候,都有一种打开全新世界的感觉。整个人都变得不一样了,尤其是智能手机的普及,让手机键盘这种东西彻底消失,手动输入已经完全没有快感和效率可言,而语音输入显然是属于智能时代的输入方式。而讯飞这么多年的坚持,终于迎来了回报和丰收。
也是因为“春江水暖鸭先知”,早在2015 年科大讯飞的年度发布会主题已经叫 "A.I. 复始,万物更新 "了,对于人工智能趋势的发现和把握,讯飞人显然是第一批。结合他们十几年来积累的智能语音技术,形成了今天讯飞的核心竞争力。而且在上市公司中,讯飞也是少数“不再只追求当前的税后利润增长,我们要把资金投到决定未来的战略方向上”的公司,而在今年的贸易战中,我们发现,华为正是依靠这种做法,十年里不断坚持投入研发,最终才利于了不败之地。这也是讯飞的参考和标杆,也是上市公司如何平衡利润和研发的一个重要示范和样本。
目前讯飞语音平台发展迅猛,接入的企业和开发者不断增加,语音技术应用在包括翻译、医疗、政法等多个领域,甚至讯飞还推出了方言计划一方面保护方言文化,另一方面去帮助有方言的人也可以享受语音识别的快乐。而讯飞的A.I. 无障碍公益也已经服务 50 万听障患者和 6 万多视力残障者,这些举措少有的体现出了科技的温度,不仅提供了更好的服务,还呈现出了科技以人为本的精神。这种精神其实在科技圈还是难能可贵的,这也成为了讯飞的一个重要标志。
迎战万物互联时代
如果说每10年讯飞都会迎来一波巨大的机会,从语音识别,到人工智能,那么接下来的十年,讯飞面对的可能是一个更大的科技市场的颠覆,那就是5G时代和万物互联。目前,讯飞是智能硬件在行业探索中的佼佼者,比如最著名的讯飞翻译机,支持翻译的语言和种类在行业中都是翘楚,甚至成为国礼赠送给外宾。在 2018 年的双十一中,讯飞翻译机的销量一举占据翻译机品类 70% 的份额,在京东平台用户好评率高达 99%。而对比了一干各种价格定位的翻译产品后,我也非常确定讯飞的产品确实还是目前最好的,这是一个非常大的技术领先优势。
现在讯飞还针对不同的场景,推出了一系列的语音产品,比如语音转文字的录音笔,就成了很多文字工作者或者视频配字幕的vlog们的救命法宝。而讯飞智能办公本则解决了办公、学习、生活场景下手写记录、录音成文、语音搜索等智能化需求,实现了“真实手写一张纸、录音成文一秒钟、找到笔记一句话、安全留存一辈子”,可以说是一个笔记本的革命了。而讯飞学习机则把平板电脑的学习功能上升到了一个全新的高度,用人工智能帮助孩子查缺补漏,大幅提升学习成绩。这些其实都是语音和人工智能技术在硬件上的应用,而我相信在这样的理念指导下,还会有更多的开创性产品的诞生。
在今年5月21日的讯飞年度新品发布会上,刘庆峰提出了人工智能红利兑现有三大标准,第一,真实可见的实际应用案例;第二,能规模化推广的对应产品;第三,可用统计数据证明的应用成效。目前看来,科大讯飞已经基本都在兑现且取得了不小的成绩了。而在当前正如火如荼进行的618电商年中大促中,科大讯飞在智能机器人、翻译机等领域销售额中频登榜首,毋庸置疑的第一。这也说明了讯飞的产品和技术都已经得到了广大用户的认同,已经可以进入到了规模化的实用阶段了,也产生了大量的有价值的数据来帮助系统不断成长。
必须要说5G时代还是一个非常重要的契机,因为高网速和低时延的特征,会让包括翻译和语音识别/合成在内的速度大幅提升,科幻电影中那种一边说话一边实时翻译成对方语言场景可以轻松实现,这恐怕会让人类的无障碍交流进入到一个全新的时代。而万物互联则给了每个设备上网的能力,那么使用语音操控,就会成为未来最为主流的控制方式,再小的产品只要装个麦克,就可以实现语音的智能操作,人们也将逐渐摆脱屏幕的限制,可以和万物对话,操控万物进行服务,这也会将人类的智能生活带入到一个全新的高度。
目前,讯飞已经实现了iFLYOS系统和业务B+C双轮驱动的态势。随着iFLYOS2.0的发布,任何一个技术团队都可以轻易的在这个平台上搭建自己的智能语音服务,成为语音智能时代的基础设施。而C端和B端业务的共同进步,则让科大讯飞的公司业绩再上层楼。科大讯飞2018年财报显示,to C业务实现营业收入25.17亿,同比增长96.54%;实现毛利12.96亿,同比增长70.77%;to C业务在整体营收中占比达31.80%,毛利占比达32.72%。
而在刚刚过去的6月10日,也就是科大讯飞二十周年司庆之际,刘庆峰向讯飞全员发布了一封内部信。在这封内部信中,刘庆峰对讯飞过去的二十年做了一个盘点回顾:因为预见,所以坚定。20年前,正是因为看到了未来语音和人工智能的重要价值并坚持了二十年,讯飞方取得今天的成就。而对于未来,刘庆峰也在这封信中做出了自己的三大判断:一是5G助推万物互联大潮来临,语音交互十年内将主导人机交互模式;二是未来十年中,人和人之间的沟通障碍将会被打破,象征着人类交流大一统的神话建筑巴别塔将真正建立。三是人工智能深刻改变生产和生活方式,人机耦合十年内将无处不在。“伴随着上述产业目标的实现,未来十年科大讯飞A.I平台日交互有望突破千亿次,产业带动突破千亿美金。属于我们最好的时代,正在到来!”刘庆峰说。
而我们相信在下一个十年,讯飞将会在这三大目标的实现过程中起到重要作用,并有望成为全球范围内多领域A.I.赋能的领导者。