本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

码报:MSRA副院长周明:未来5到10年是NLP的成熟期

时间:2017-06-03 23:42来源:668论坛 作者:118开奖 点击:
「接下来,NLP 将迎来 60 多年来发展最迅速的时期。」 6 月 1 日,在微软亚洲研究院(MSRA)的自然语言处理(NLP)主题沟通会上,副院长周明博士以《自然语言处理前沿技术》为主题

「接下来,NLP 将迎来 60 多年来发展最迅速的时期。」

6 月 1 日,在微软亚洲研究院(MSRA)的自然语言处理(NLP)主题沟通会上,副院长周明博士以《自然语言处理前沿技术》为主题,分享了不少 NLP 研究心得。

码报:MSRA副院长周明:未来5到10年是NLP的成熟期

周明博士,图片来自微软亚洲研究院微信

周明博士已经在 NLP 领域钻研近 30 年,并已于去年当选国际计算语言学协会(ACL)候任主席。在过去的研究生涯中,周明博士已发表了 120 余篇重要会议和期刊论文(包括 50 篇以上的 ACL 文章),拥有 40 余项国际发明专利。

从 NLP 是什么、MSRA 在 NLP 方向上的最新进展以及 NLP 技术的未来发展方向三部分,周明博士对 NLP 技术进行了全方位解读。机器之心取其精华,以飨读者。

NLP 是人工智能的开端,语言智能是人工智能皇冠上的明珠

数据的大幅增强、计算力的大幅提升、深度学习实现端对端的训练,atv,这些都是人工智能领域迎来第三次浪潮的原因。

在周明博士看来,促成这股浪潮的还有落地场景的出现。实实在在的场景如搜索引擎、自动驾驶汽车等,给了用户使用和反馈(如搜索引擎的使用者会为搜索引擎提供训练数据)的空间,系统就可以使用这些数据不断提升。

在以计算、记忆为基础的「运算智能」之上,是以听觉、视觉、触觉为代表的「感知智能」,反映在人工智能技术上为语音识别和图像识别。再之上则是「认知智能」,包含语言、知识和推理。金字塔的顶端,则是创造智能。

码报:MSRA副院长周明:未来5到10年是NLP的成熟期

「语言智能是人工智能皇冠上的明珠」,周明博士说道。

作为国际计算语言学协会(ACL)候任主席、NLP 领域资深研究者,周明博士特别强调语言智能在人工智能领域的标志意义。「语言智能是人工智能皇冠上的明珠,如果语言智能能够突破,与他同属认知智能的知识和推理就会得到长足的发展,整个人工智能体系就会得到很好的推进,也有更多的场景可以落地。」

作为最早设立的部门之一,微软亚洲研究院 NLP 研究组已经发表了超过 200 篇顶级会议文章,其中 ACL 论文超过 100 篇,COLING、EMNLP 论文超过 50 篇,IJCAI、AAAI、KDD、SIGIR 论文超过 50 篇。拥有超过 100 项专利,与 10 所高校建立联合实验室,并与超过 16 个高校建立合作。

其与中科院计算所合作开发的手语翻译系统,还曾得到过 CEO 萨提亚·纳德拉(Satya Nadella)上任后首次嘉

机器翻译、ChatBot…… MSRA NLP 有这四方向进展

机器翻译

自 2007 年微软基于统计的翻译系统上线,到 2012 年在 21 世纪大会上展示实时语音翻译系统,再到 2015 年 Skype Translator 实时语音翻译技术上线、2016 年 Microsoft Translator Live Feature(现场翻译功能)的推出,微软从未放弃过在机器翻译技术、产品方向上的探索。

目前微软采用的是基于神经网络的机器翻译方法。通过对源语言句子使用 LSTM 进行双向编,再通过 Attention 模型体现不同隐节点对翻译某个目标词的作用,逐词生成目标语言直到句尾。

对于中间的某个阶段可能会出现多个翻译,微软采用的方法是通过 beam search 方法保留最佳翻译。神经网络翻译中其中最重要的技术是对源语言的编,以及体现不同词汇翻译不同作用的 Attention 模型。

MSRA 在机器翻译上主要有如下 2 项进展,均发表在 ACL 上:

1、引入语言知识

编码过程往往将源语言和目标语言看作字符串,并没有体会语言内在的句法知识和修饰关系。通过将语言知识引入到神经网络的编码,可以得到更佳的翻译。(具体指标见下图)

码报:MSRA副院长周明:未来5到10年是NLP的成熟期

2、引入领域知识(Domain Knowledge)

很多领域拥有知识图谱的,可以纳入到传统的神经网络机器翻译中,以规划语言理解的过程。基于的假设是不同语言的知识图谱可能是一致的,将输入句子映射到知识图谱,再基于知识图谱增强解码过程,使得译文得到进一步改善。

在分享会现场,微软亚洲研究院的研究员张冬冬还展示了微软在机器翻译上的最新进展——演讲翻译,所有人在进入统一虚拟会议室时都可以接收到母语言的演讲内容(文字、语音),可以帮助提升跨语言会议交流效率。

码报:MSRA副院长周明:未来5到10年是NLP的成熟期

演讲翻译系统浏览器页面,演讲者的口述内容会被转换为聆听者设定的语言

对话即平台

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容