本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

wzatv:【j2开奖】语音识别64年大突破(2)

时间:2016-11-28 15:15来源:本港台直播 作者:118KJ 点击:
《从水门事件到莫妮卡莱温斯基》是贾里尼克在1999年ICASSP(国际声学、语言和信号处理大会)做的报告题目,因为水门事件发生的时间1972年,恰好是统计

  《从水门事件到莫妮卡·莱温斯基》是贾里尼克在1999年ICASSP(国际声学、语言和信号处理大会)做的报告题目,因为水门事件发生的时间1972年,恰好是统计语音识别开始的时间,而因莱温斯基事件弹劾克林顿总统正好发生于当时会议的前一年。

  贾里尼克在康奈尔十年磨一剑,潜心研究信息论,终于悟出了真谛。1972年,贾里尼克到IBM华生实验室做学术休假,无意中领导了语音识别实验室,两年后他在康奈尔和IBM之间选择了留在IBM。

  20世纪70年代的IBM有点像90年代的微软和过去十年(施密特时代)的Google,任由杰出科学家做自己感兴趣的研究。在那种宽松的环境里,贾里尼克等人提出了统计语音识别的框架结构。

  在贾里尼克之前,科学家们把语音识别问题当作人工智能和模式匹配问题,而贾里尼克将它当作通信问题,并用两个隐含马尔可夫模型(声学模型和语言模型)把语音识别概括得清清楚楚。这个框架结构至今仍对语音识别影响深远,它不仅从根本上使得语音识别有使用的可能,而且奠定了今天自然语言处理的基础。贾里尼克后来也因此当选美国工程院院士,并被Technology杂志评为20世纪100名发明家之一。

  贾里尼克的前辈们在将统计的方法应用于语音识别时,遇到了两个不可逾越的障碍:缺乏计算能力强大的计算机和大量可以用于统计的机读文本语料,最后前辈们不得不选择放弃。20世纪的IBM,虽然计算机的计算能力不能和今天相比,但已可以做不少事了,贾里尼克和他的同事需要解决的问题就是如何找到大量的机读语料。好在当时有一项全球性的业务是通过电信网连接在一起的,那就是电传,IBM的科学家最初就是通过电传业务的文本开始进行研究的。

  为什么当初是没有什么语音识别基础的IBM,而不是在这个领域里有很长研究时间的贝尔实验室或者卡内基-梅隆大学提出统计语音识别的处理。很多历史的偶然性背后都有着它必然的原因,因为IBM有着这样的计算能力,又有物质条件,同时聚集了一大批世界上最聪明的头脑。

  基于统计的语音识别替代基于规则的前后方法交替经历了15年时间。之所以历经许久,是因为新的研究方法成熟需要很多年。

  剩下的难题依旧

wzatv:【j2开奖】语音识别64年大突破

  语音识别的独特性不仅仅是因为其成就:尽管已有成果斐然,但剩下的难题和目前已克服的一样令人生畏。

  随着语音识别研究思路的变化,大规模的语音识别研究始于20世纪70年代以后,并在小词汇量、孤立词的识别方面取得了实质性的进展。20世纪80年代以后,语音识别研究的重点则逐渐转向大词汇量、非特定人连续语音识别。20世纪90年代以后,在语音识别的系统框架方面并没有什么重大突破。

  但在语音识别技术的应用及产品化方面出现了很大的进展。比如,DARPA是在20世纪70年代由美国国防部远景研究计划局资助的一项计划,旨在支持语言理解系统的研究开发工作。进入90年代, DARPA计划仍在持续进行中,其研究重点已转向识别装置中的自然语言处理部分,识别任务设定为“航空旅行信息检索”。根据DARPA资助的多次语音评测,语音识别词错误率已经是评估进步的主要指标。

  我国的语音识别研究起始于1958年,由中国科学院声学研究所利用电子管电路识别10个元音。由于当时条件的限制,中国的语音识别研究工作一直处于缓慢发展阶段。直至1973年,中国科学院声学研究所开始了计算机语音识别。

  进入80年代以来,随着计算机应用技术在我国逐渐普及和应用以及数字信号技术的进一步发展,国内许多单位具备了研究语音技术的基本条件。与此同时,国际上语音识别技术在经过多年的沉寂之后重又成为研究热点。在这种形式下,国内许多单位纷纷投入到这项研究工作中去。

  1986年,语音识别作为智能计算机系统研究的一个重要组成部分,被专门列为研究课题。在“863”计划的支持下,中国开始组织语音识别技术的研究,并决定了每隔两年召开一次语音识别的专题会议。

  大数据与深度神经网络带来的大爆发

  

wzatv:【j2开奖】语音识别64年大突破

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容