2012-2014年这两年,微软花了很多的精力,特别是我们的同事和位于北京的微软亚洲研究院的同事合作,把Rick在天津用深度学习做的演示完全产品化,大家用Skype Translator就可以直接使用实时语音翻译技术。之前有媒体朋友用唐诗来试我们的系统,结果很有意思,每个字都翻译得很对,但是整个句子翻起来诗意就没了。语音识别字对字是好的,但是它不能够真正达到人的智慧,还没到有诗意的那个程度。 下面再讲一下最近两年之内深度学习的进展。首先是语音识别的错误率继续下降,最近几年的进展更使得去年ImageNet图像识别的错误率降到低于人类的水平,这是微软亚洲研究院今年年初做的,还有看图说话也有很大的进展。 最近一两年的AlphaGo,文章是在2016年发表,工作大部分是在2015年做的,最后产生最大的影响是在AlphaGo今年3月份打败世界围棋冠军,这里面很大的一个因素就是把神经网络和增强学习结合起来生成Deep ReinforcementLearning,用来加速Monte Carlo tree search,三者结合得到非常显著的成果。 人工智能对话机器人也取得成果。以下内容也是我从《财富》杂志文章中截取出来的。
现在很多公司都在发展客服机器人,而且还有很多其它的应用。这种应用在20年前大家都有了,我在大学当教授的时候就有很多类似的项目。AT&T当时帮助客户怎么付帐,那是唯一一个很成功的例子,其它的影响并不是很大。去年到今年差不多两年之内,大家看到AlphaGo的成功,而且看到深度学习在语音识别和图像识别上面的成功,都感觉到时间已经到了,这个重要的应用时代已经到了,我不想展开太多,大家看文章可以看到更多的例子。 还有一个很大的应用:深度学习。大家看这篇文章后就可以感觉到深度学习现在从原来感知上面的人工智能,语音识别和图像识别已经进入到真正商业应用的领域里面。从研究的角度来讲,自然语言处理就是在一年之内得到飞速的进展。我昨天早上刚从烟台“中国计算语言学大会”回来,机器翻译已经完全采用深度学习的方法,它的性能、精确度大大超过20多年发展起来的基于统计的学习方法。IBM 20年前第一次把统计学习的方法用到机器翻译,当深度学习在语音识别成功之后,2011年、2012年深度学习就开始用到机器翻译上面。深度学习在阅读理解、问答等等应用上的复杂性要比其它那些应用到语音识别的深度学习方法大得多,主要因为模型不太一样,有新的alignment问题。一直到去年大家开始看到深度学习发展出一些非常巧妙的方法,已经战胜了传统20年发展的方法,当然它的错误率的降低和语音识别比起来还是没那么显著,但是它的历史也就两三年时间。现在整个机器翻译的领域已经完全转向深度学习,这个信息特别在中国自然语言处理方面比美国更显著。 前两天烟台的“中国计算语言学大会”有许多演讲,每个题目都跟深度学习相关——深度学习跟机器翻译、深度学习跟问答、深度学习跟语法分析、深度学习跟情感分析,等等。我对中国的人工智能的希望是非常之大的。现在有哪些新的技术?有sequence到sequence的学习,有注意力模型,一个礼拜之前在《Nature》上面刚发表了DNC方法,做研究的话可以往这边看。 未来展望,关于人工智能应用,在四五天前美国白宫出了个报告,听(俄勒冈大学)Thomas Dietterich教授讲,他也参与了这个报告的一些写作,美国白宫政府发出这个报告,跟中国推广的人工智能方向是相符的。深度学习作为一个非常大的标题列出来,这一点,今天早上跟Thomas Dietterich谈了一下,他承认对于很多做传统的人工智能的专家来讲确实是出乎意料的。 (责任编辑:本港台直播) |