从1950年开始至今,语音识别技术经历了由小词汇、孤立词汇的识别,到大词汇量、特定声音识别的飞跃发展。然而,语音识别技术只是智能语音助手实现工作的第一步。 总的来说,语音助手实现其工作大体要经过三步:其一是前端的语音识别,即将声音转换成文字;其二是自然语言的理解,将文字解读成行为;其三是通过开放API接口等技术来实现行为等操作。 因此,语音助手能否提供强大的服务,主要取决于其技术和连接整合能力。在技术上,主要使用云计算、语音识别、语音合成等AI技术。即在前端面向用户时,主要需要语音识别、语音合成技术。在语音识别时,系统需要把语音转化成文字,这就需要强大的语音库作为支撑,就需要云计算技术。而语音合成则是将反馈的文字结果转化成语音输出。 在后端则是人工智能技术的使用。面对用户的众多请求,语音助手需要通过机器学习(深度神经网络)来不断自我学习,了解用户的说话方式和爱好需求,进而输出个性化的服务。 而其连接整合能力就是指,语音助手将越来越多的设备和服务接入,从而构建自身生态的能力。尤其是在智能家庭中,用户最终获得的是体验和服务,单一设备单一APP控制不是智能家居的追求,智能家居需要的是形成一个生态,形成一个闭环,从而通过一个入口来更便捷的控制所有设备。而这需要语音助手平台一方面开放其语音助手,另一方面也要加强商务合作,来聚合服务。 三、智能语音市场将达百亿据工业和信息化部电子科技信息情报研究所数据显示,2012年以来,全球智能语音产业规模持续快速增长。2013年,全球智能语音产业规模整体达33.7亿美元,同比增长38.1%;2014年较2013年同比增长41.0%,产业规模大幅提升。预计到2017年,全球智能语音规模将达112.4亿美元,复合增长率达35.1%。 据了解,语音技术以其广阔的产业应用席卷人们的日常生活和工作,其产业规模大幅提升主要得益于三方面。第一是大数据、云计算等技术的发展使得智能语音技术的应用不断成熟;第二是各国政府、相关行业及资本的持续关注推动语音技术的研发和产业化;第三是随着移动互联网技术的发展,智能语音技术正在快速成为人们日常生活的组成部分,并显著改变消费者的交互方式。 但智能语音市场在带来高价值的同时,也将导致行业的垄断。据MBA报告,智能语音产业是技术先导型的新兴产业,存在核心技术壁垒、行业应用壁垒和语音资源壁垒,具有显著的“马太效应”。从全球范围来看,仅有少数厂商在语音市场具有竞争力,一类是传统语音技术厂商,拥有长期技术和用户积累,如美国的Nuance公司,但近年逐渐衰落,而让位给互联网巨头。另一类是以IBM、微软、谷歌、苹果等为代表的IT巨头,凭借在互联网端的优势迅速抢占语音信息流入口。 资料显示,早在2009年,Nuance公司占有全球语音识别市场约69%的市场份额。在2012年,Nuance的市场份额下降到62%,Nuance、谷歌、微软、苹果、IBM、科大讯飞五家企业占据市场份额超95%。2013年,Nuance市场份额下降到51%,而谷歌依靠其在互联网和移动互联网领域的优势,市场份额由16.9%上升至28%;苹果、微软、科大讯飞以4.7%、4.4%、4.3%的市场份额分列第三、第四、第五位。可见智能语音行业的寡头垄断特征十分明显。 此外,随着智能家居已从概念向商业化阶段发展,语音控制和交互将是智能家庭的一大趋势。根据市场研究公司Juniper发布的数据,2018年全球智能家居市场规模将达710亿美元。以苹果、三星、海尔为代表的消费电子厂商和以谷歌、小米、乐视等为代表的互联网企业开始纷纷推出智能家电产品,为智能家居市场打前站。而智能家居的发展也将带动智能语音服务的快速增长。 (责任编辑:本港台直播) |