一、智能语音技术快速发展
语音技术经过几代科学家几十年的改善研究,随着近几年神经网络技术(ANN、DNN)的使用,语音技术准确率得到了质的提升,也使得语音技术能够为人类所用。
智能语音技术按照发展可以分为四个阶段:20 世纪50-70 年代是技术萌芽阶段,贝尔实验室、普林斯顿大学等科研机构做了大量的研究,开发了很多技术;20 世纪80 年代是技术突破阶段,随后直至20 世纪初,智能语音进入产业化阶段。各个智能语音项目开始产业化运营;2010 年至今是快速应用阶段,智能语音技术已经深入用户生活之中。苹果的Siri、谷歌的语音搜索、亚马逊的Echo 都已经积累了庞大的用户群体。
智能语音的系统框架包含5 个模块。语音识别模块负责接受用户的语音输入并且将其转成文字交给自然语言理解模块。自然语言理解模块在理解了用户输入的语义之后将特定的表达输入对话管理模块中。对话管理模块负责协调各个模块的调用以及维护当前对话状态,并将特定的回复方式交由自然语言生成模块进行处理。自然语言生成模块生成特定回复文本输入语音合成模块。语音合成模块负责将文字以语音的方式输出给用户。
智能语音技术日趋成熟,识别率从量变到质变。智能语音识别的准确率稳步增长,从过去的70%提升到现在90%以上。2016 年11 月,百度、科大讯飞、搜狗几乎同时宣布自己的语音设备识别率超过了97%。前百度首席科学家吴恩达认为语音识别在此基础下仍然具有很大的潜力。如果智能语音识别率达到99%对于行业而言是质的变化。用户将会从偶尔使用到常常使用到更加自然。99%的成功率将会彻底改变交互方式。
二、智能语音设备快速普及,用户渗透率快速增加
智能语音用户普及率现在快速提升。在美国,目前手机用户使用语音助手的使用比例已经从2013 年的30%左右快速攀升至2015 年的60%以上,渗透率快速提升一倍以上。于此同时,2016 年,谷歌搜索的语音搜索数量较2008 年增加35 倍以上,较2010 年增加7 倍以上。随着语音识别近年来的突破性进展,相关商业应用已经展开。根据百度披露数据,自2014 年Q2以来语音输入增长4 倍以上,语音输出增长26 倍以上。
智能语音硬件设备销量迅猛增长。数据显示,在美国市场,2015、2016 年语音硬件设备的销售量分别为150 万和650 万台,同比增长330%,预计2017 年将2450 万,同比增长277%。目前,国际市场上的语音硬件设备主要来自亚马逊和谷歌。未来,苹果和微软也将分别在Airpods、TV 和办公、日程类行业发力。
三、智能语音产业规模快速增长
在各国政府、相关行业及资本界的持续关注之下,智能语音产业得到迅速发展。一方面,中国、美国、日本等国家及组织积极布局,通过政策引导推动智能语音关键技术的研究和产业化。另一方面,语音技术厂商和IT 巨头大力布局,带动全球智能语音产业规模进一步提升。据中国语音产业联盟监测数据显示,2014 年,全球智能语音市场规模整体达到45.6 亿美元,与2013 年的33.7 亿美元同比增长35.3%。2017 年,全球智能语音市场规模预计将达到105 亿美元,较2016 年增长30%。
2015 年中国智能语音产业规模达到40.3 亿元,较2014 年增长41.0%,2016 年中国语音产业规模达到59 亿元,预计2017 年中国语音产业规模将超过100 亿元。远远高于全球市场增速。
本文采编:CY317