本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

报码:【j2开奖】机器在聆听

时间:2017-03-28 06:49来源:668论坛 作者:118开奖 点击:
《圣经》中记载着这样的传说,远古人类都讲一种语言,他们希望建造通往天堂的通天塔,也叫巴别塔(Tower of Babel)。为了阻止人类的计划,上帝让人类说不同语言,分成不同民族,

《圣经》中记载着这样的传说,远古人类都讲一种语言,他们希望建造通往天堂的通天塔,也叫巴别塔(Tower of Babel)。为了阻止人类的计划,上帝让人类说不同语言,分成不同民族,j2直播,在语言上无法自由沟通,巴别塔计划由此告终。重建巴别塔,也成了人类语言沟通和共识达成的象征和代名词。现在,AI让人类的梦想一步步走向实现。

报码:【j2开奖】机器在聆听

弗雷德里克·贾里尼克

  历史的探索

让人类实现无障碍沟通,这项AI工程有三块重要基石:语音识别、自然语言理解、语音合成。三块基石是三大类技术,分别解决人类语言交流中三个问题:听清楚别人说什么、 理解别人说什么、根据听到和理解的去回答别人。

语音识别,主要解决“听清楚别人说什么” 这个难题,这是AI中的重要技术领域。近年来,由于深度学习技术的应用,语音识别取得了长足进步。

1952年,贝尔实验室的K·H·戴维斯(K.H.Davis)等人研制了世界上第一个能识别10个英文数字发音的实验系统。1960年,英国人彼得·迪恩斯(Peter Denes)等研制了第一个计算机语音识别系统。但从上世纪50年代到70年代,语音识别研究走了弯路,那就是简单地想电脑模拟人脑,认为必须先让机器理解自然语言。在当时计算机能力受限的情况下,这样的研究鲜有进展。

1970年后,统计语言学的出现打破了沉寂。领军人物是IBM沃森实验室的弗雷德里克·贾里尼克(Frederick Jelinek)。

贾里尼克用两个隐(含)马尔可夫模型(Hidden Markov Model)——声学模型和语言模型来清楚概括语音识别。这个框架至今对语言处理有着深远影响。

1999年,国际声学、语音与信号处理国际会议(ICASSP)中,已当选美国工程院院士的贾里尼克在大会上作了《从水门事件到莫尼卡·莱温斯基》的报告。这两件事和语音都有联系,而且时间跨度和语音识别都同样很长。隐马尔可夫模型处理语音也是从1972年开始,一直到贾里尼克作报告时还在进行,而且还将延续下去。

  剑桥语音的黄金十年

1984年,美国国家标准及技术研究所(NIST)和DARPA决定出资开展语音识别评测标准的研究,希望能科学评估各种语音识别系统的性能。这件事影响了语音识别历史。

德州仪器公司(TI)、麻省理工学院(MIT)和SRI合作构建了第一个声学-音素连续语音语料库,并制定了数据采集标准,成为世界第一个语音评测平台。这一被称为TIMIT的数据库应用至今,语音识别研究者们有了评测算法的标准数据集。NIST举办的语音识别评测全球竞赛由此开始。

语音识别所研究的数据类型历经几次升级,由最早的孤立词语音发展到自然连续语音。然后,选取朗读“华尔街杂志”(Wall Street Journal)的语音录成标准数据库。这个数据集的词汇量为5000到20000, “大词汇连续语音识别”就始于此。上世纪90年代中期以后,广播新闻这样自发产生的连续语音、电话对话语音、丰富的语音文本、多语种语音等等也不断加入评测,NIST大赛越来越具有挑战性。

大赛1988年开始,1992年扩大到美国之外,成为全球大赛,剑桥大学等非美国机构,在那一年加入。1993年,剑桥大学夺取冠军。一战成名,剑桥语音成为全球语音识别界关注的焦点。

从1989年起,剑桥大学工程系机器智能实验室研究组就在史蒂夫·杨(Steve Young)教授的主持下开发 “隐马尔可夫模型工具包”(Hidden markov model Tool Kit, HTK)。HTK软件包不是简单的语音识别系统,而是完整的研究平台。在这平台上,研究者可以方便地试验各种新式算法,atv,搭建不同的语音识别系统。这样,HTK很快就成为了语音识别研究事实上的标准。而拥有平台的剑桥语音研究人员,近水楼台先得月。

于是,剑桥大学语音识别研究在大赛中连续十年取得优异成绩,许多影响深远的语音识别技术陆续在剑桥产生,并成为后来主流经典算法,这些成就轰动了全世界,被称为剑桥语音的黄金十年。

  踏上商业化征程

语音识别也逐渐开始商业化。1995年,IBM开发出离散词汇听写软件,也就是后来的语音识别软件Via Voice的前身。IBM当时将语音识别率从70%提升到90%,同时识别词库的规模从几百个单词上升到几万个,语音识别从实验室走向实际应用。1997年,IBM推出了世界上第一个中文连续语音识别产品——Via Voice 4.0。该软件成功突破连续语音、大词汇量、非特定人的难关,据称解决了汉语同音字多、有声调、口音复杂等问题,可以帮助人们从键盘输入中解脱出来,IBM认为这是汉字输入的重要里程碑。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容