2012年到 2014年,微软、谷歌出现一大串的产品,还有亚马逊的 Echo,以及讯飞和百度的产品,也包括 Dragon 和 Siri 和 XBOX 产品一整套。全部用深度学习的网络取代以前一大串浅层机器学习的语音识别技术。 这两年(2012-2014),微软花了很多的精力,特别是我们在美国的同事和北京研究院的同事合作,把在天津我们老板演示的用深度学习实现的演示完全产品化,大家用 Skype 就可以直接用不同语言做语音对话。两个月前,杨澜带了一个采访团队到我们公司来拍摄人工智能电影的时候,专门试了我们的 Skype Translator,是五个小时人工智能的纪录片的一部分。 她用唐诗来试我们的系统,结果很有意思,每个字都翻译得很对,但是整个句子翻起来诗意就没了。语音识别字对字词对词是好的,但是它不能够真正达到人的智慧,还没到有诗意的那个程度。
深度学习最近两年发展:语音图像识别和其他大数据应用全面进入商用阶段 下面再讲一下最近两年之内深度学习的进展,首先语音识别的错误率继续下降,包括讯飞、IBM、百度、谷歌,。最近几年的进展更使得去年图像识别的错误率降到低于人类的水平,这是微软亚洲研究院去年做的,今年国内的几个团队做的比这个错误率低的更多。还有看图说话也有很大的进展。
最近一两年的 AlphaGo——文章是在 2016 年发表,工作大部分是在 2015 年做的,最后产生最大的影响是在 AlphaGo 今年 3 月份打败世界围棋冠军,这里面很大的一个因素就是把神经网络 Deep Neural Nets 和增强学习结合起来,用来加速 Monte Carlo Tree Search ,三者结合得到非常显著的成果。
人工智能对话机器人也取得成果。这一段话是我从中截取出来的。现在很多公司都在发展客服机器人,而且还有很多其他的应用。这种应用在 20 年前年前大家已经开始做了。我在大学当教授的时候就有很多类似的项目。 AT&T当时帮助客户怎么付帐,那是唯一很成功的例子,其他的影响并不是很大。今年到去年差不多两年之内,大家看到 AlphaGo 的成功,而且看到深度学习在语音识别和图像识别上面的成功都感觉到时间已经到了,这个重要的应用时代已经到了。 大家看这篇可以看到更多的近年深度学习应用例子。这种应用在学术界跟企业界还不是讲得特别多,但是,微软领导在这篇中讲了一段话,这段话确实包含了我们微软两年之内的大量工作。我的一个团队做了相当多的工作。
还有一个很大的应用,Deep Learning 最近两三年内有很多公司——主要是我们公司和IBM——大家看后就可以感觉到,深度学习现在从原来感知上面的人工智能 (语音识别和图像识别)已经大步进入到其他与大数据相连的真正商业应用的领域里面。
从研究的角度来讲,深度学习用于自然语言处理尤其是机器翻译在过去一两年之内得到特别飞速的进展(尽管 2012 年就已经开始出现深度学习用于机器翻译的学术论文)。我昨天早上刚从烟台“中国计算语言学大会”回来,机器翻译领域目前已经完全采用深度学习的方法,它的性能、精确度大大超过 20 多年来发展起来的基于统计的学习方法。IBM 20 多年前第一次把统计学习的方法用到机器翻译。当深度学习在语音识别成功之后, 2012 年左右,深度学习就开始用到机器翻译上面。现在整个机器翻译的领域已经完全转向深度学习,这一点在中国自然语言处理方面比美国更显著。深度学习在阅读理解、问答等等应用上的复杂性,要比其他那些应用到语音识别和机器翻译的深度学习方法大,主要因为模型不一样,所解决的问题也不一样。这是下一步深度学习要解决的大问题。 (责任编辑:本港台直播) |