本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

wzatv:【j2开奖】语音识别64年大突破

时间:2016-11-28 15:15来源:本港台直播 作者:118KJ 点击:
语言,之所以重要,在于人类的思维能力是伴随着它的产生而迅速发展的,这也是人类在智能上区别于其他物种的原因。语音识别,作为人工智能应用的一个场景,也是研究者们一直

wzatv:【j2开奖】语音识别64年大突破

  语言,之所以重要,在于人类的思维能力是伴随着它的产生而迅速发展的,这也是人类在智能上区别于其他物种的原因。语音识别,作为人工智能应用的一个场景,也是研究者们一直试图解决的问题。

wzatv:【j2开奖】语音识别64年大突破

  今年10月底,微软宣布语音识别实现了历史性突破,词错率仅 5.9%,英语的语音转录达到专业速录员水平,微软的此次突破是机器的识别能力在英语水平上第一次超越人类。微软的这条消息发布之后在业内引起了极大的关注。语音识别一直是国内外许多科技公司重点发展的技术之一,百度首席科学家吴恩达就发推特恭贺微软在英语语音识别上的突破,同时也回忆起一年前百度在汉语语音识别上的突破,其Deep Speech 2 的短语识别的词错率已经降到了3.7%,Deep Speech 2 转录某些语音的能力基本上是超人级的,能够比普通话母语者更精确地转录较短的查询。

  梦想从贝尔实验室开始

  不久前,麻省理工学院(MIT)主办的知名科技期刊《麻省理工科技评论》(MIT Technology Review),评选出了“2016年十大突破技术”。《麻省理工科技评论》称,在过去的一年里,这十项技术均已到达一个里程碑式的阶段或即将到达这一阶段。而语音识别的突破就是其中的第三项

  回顾人类发展史,不难看出,随着人的不断进化,从最初通过手掌、肢体使用简单工具、传递简单信息,发展到控制发声并通过耳朵接收,形成了一个以语音为载体的快速信息传递通道和收发闭环,成为人类间最自然、最重要的信息交互手段。声波作为一种音频信号,和视频信号、无线电信号一样是,非接触方式的传播,也是人类唯一可以不借助工具就可自由掌控的一种天然“无线”资源。而且声波对接收指向性的要求更宽松,这个非常宝贵的特性会在很多场景下带来极大便利。特别是对于一些在视觉、触觉等方面存在障碍(如老年人、弱视、残障人士)或不适合(如儿童需要保护视力)的庞大特定人群,语音更是最佳的交互选择。

  1946年,现代电子计算机出现后,计算机在很多事情上做得比人还好,既然如此,机器能不能懂得自然语言呢?与机器进行语音交流,让它听明白你在说什么,语音识别技术是计算机一出现,人类就开始憧憬的一大梦想。

wzatv:【j2开奖】语音识别64年大突破

  最早提出机器智能概念的是计算机科学之父阿兰·图灵,1950年他在《思想》(Mind)杂志上发表了一篇题为“计算的机器和智能”的论文。在论文中,图灵并没有提出什么研究方法,而是提出了一种验证机器是否有智能的方法:让人和机器进行交流,如果人无法判断自己交流的对象是人还是机器,就说明这个机器有智能了。这种方法被后人称作图灵测试。图灵其实是留下了一个问题,而非答案,但是一般认为对自然语言的机器处理可以追溯到那个时候。

  科学家认为语音识别就好比“机器的听觉系统”,该技术可以让机器通过识别和理解,把语音信号转变为相应的文本或命令。1952年,贝尔研究所,Davis等人研制了世界上第一个能识别10个英文数字发音的实验系统。1960年,英国的Denes等人研制了第一个计算机语音识别系统。

  事实上,语音识别60多年的发展过程可以分成多个阶段。早期的20多年,即从20世纪50年代到70年代,是科学家们走弯路的阶段,全世界的科学家对计算机完成语音识别这类只有人才能做的事情,认为必须先让计算机理解自然语言,这就局限在人类学习语言的方式上了,也就是用电脑模拟人脑,这20多年的研究成果近乎为零。

  贾里尼克的贡献

  直到1970年后,统计语言学的出现才使语音识别重获新生,并取得了今天的飞凡成就。推动这个技术路线转变的关键人物是德里克·贾里尼克(Frederick Jelinek)和他领导的IBM华生实验室(T.J.Watson),开始使用统计方法。采用统计的方法,IBM将当时的语音识别率从70%提升到90%,同时语音识别的规模从几百单词上升到几万单词,这样语音识别就有了从实验室走向实际应用的可能。

wzatv:【j2开奖】语音识别64年大突破

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容