本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

报码:【j2开奖】【演讲】微软AI首席科学家邓力:图文并茂回顾十年AI路(2)

时间:2016-10-25 01:31来源:报码现场 作者:118开奖 点击:
之后不久我从大学来到微软公司,当时我的一个团队做了深层的动态的贝叶斯网络,相对比较容易解释。但是有一大串的问题。十年前在深度贝叶斯网络问

之后不久我从大学来到微软公司,当时我的一个团队做了深层的动态的贝叶斯网络,相对比较容易解释。但是有一大串的问题。十年前在深度贝叶斯网络问题现在已慢慢得到解决。深层次模型的最早的一个突破,还得归功于Geoffrey Hinton的一篇文章《A Fast Learning Algorithm For Deep Belief Nets》。这篇文章确实成为深度学习的开始之一:现在大部分的深度学习模型是一层一层网络不断从下往上,而这篇文章正好相反,不是往上,更注重从上到下生成数据,有点像“做梦”,你做梦的时候可以产生一些梦想。做的“梦”产生一些数据,你在醒的时候就可以把你所看到的东西抽象出来、总结出来,成为你感知的对象。经过反复的上下反复的过程,就可以产生一种非常巧妙的模型,而且对这种模型来说这篇文章介绍了非常巧妙的学习方法。

我当时看到这个方法就在想这和我的深贝叶斯语音识别模型会有什么关系,能不能结合起来。因为没看很懂,就请他到我们的西雅图共事一段时间。2009年底搞了一个NIPS讲习会,将深度学习各种不同的方法在语音识别上的应用总结一下,那时已经有初步的结果出来,但结果不是特别好。所有的深度学习在语音识别上面都是聚集在非常小的数量上面,大概100万的数据量,非常局限。当时大规模的神经网络威力还没显示出来,这之后我们在微软花了大概一年多的时间发明了一些很有效的方法,使得深度神经网络加上隐马尔可夫模型,j2直播,这三个不同的技术整合到一起就成为这组架构。这种神经网络同时跟其它的机器学习、人工智能方法联合在一起,很快就让深度神经网络在工业界上面的语音识别产生巨大的影响。这有点像AlphaGo,atv,大概有三种不同的方法联合在一起,再次表明,能把不同的人工智能和机器学习方法同深度学习方法整合到一起确实是非常重要的。

当时我们在学术界(我所在的微软研究院,也算学术界、工业界的一个混合单位)合写了一篇文章,三年多前发表的,成为深度学习在语音识别方面的经典工作。80%的内容和方法在这个文章当中写到的,现在工业界还一直在用。文章讲了深度神经网络对语音识别产生的影响,以及怎么把不同的机器学习方法包括深度神经网络的方法整合起来,使得大规模的语音识别得到进展。

  

报码:【j2开奖】【演讲】微软AI首席科学家邓力:图文并茂回顾十年AI路

当我们微软公司把深度学习用到语音识别取得大规模成功的时候,微软研究院创始人Rick Rashid 2012年在天津举行的一次学术会议上当场演示实时语音翻译技术,第一次向世界宣布深度神经网络是一个非常强大的技术。他用深度学习做语音识别演示,几乎没什么错误,因为他非常配合,帮我们采集了非常多的speaker-dependent的数据。大规模的场合演示语音识别几乎没任何错误。另外,用机器翻译的方法,把识别出的英文文字翻译成中文,再用语音合成的方法产生中文语音。他用英文讲,他的中文声音就出来了,而且中文合成的声音跟自己的声色非常相像,当时产生很大的影响。

之后我们写了很多论文,2010年到2012年写了不少,识别自然语音的错误率在1993年是几乎每个字都会错掉。那时候,美国的DARPA(Defense Advanced Research Projects Agency,美国国防部先进研究项目局,主要致力于美国国防高新技术的研究、开发和应用)第一次做这方面的研究,那时数据没采集那么多,1993年之后,DARPA每次投资语音识别的研究,基本上1/4到1/3的资源都是用来采集有标注的数据,之后语音的大数据就有了。这也是为什么深度学习在语音识别上是第一个成功的例子。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容