本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

wzatv:微软亚研院副院长周明:口语机器翻译在未来肯

时间:2017-06-06 03:46来源:天下彩论坛 作者:118开奖 点击:
微软亚研院副院长周明:口语机器翻译在未来肯定会完全普及 来源:极客公园 原标题:微软亚研院副院长周明:口语机器翻译在未来肯定会完全普及 作者: 龟途慢慢 随着智能语音助

微软亚研院副院长周明口语机器翻译未来肯定会完全普及

来源:极客公园

原标题:微软亚研院副院长周明口语机器翻译未来肯定会完全普及

作者: 龟途慢慢

随着智能语音助手、聊天机器人(Chatbot)等产品逐渐成熟,出现在普通用户的眼前,其中的一些核心技术也正变得越来越重要、越来越受到大家的关注。自然语言处理技术(Nature Language Processing,简称 NLP)就是其中之一。

近日,微软亚洲研究院副院长周明博士就自然语言处理技术的概况、最新进展及未来发展方向对外界做了一次分享,极客公园也借机与周明博士进行了交流,下面,我们就把其中的内容介绍给大家,通过这场分享,或许我们能对自然语言处理这项技术有更全面的理解。

概述:人工智能技术整体的发展状况

人工智能经过 61 年的发展,起起伏伏,曾经历过两次冬天,随着云计算、大数据、深度学习三大要素的交织下,人工智能又迎来了一个新的春天。而这次人工智能春天的特点有以下三点:

第一,数据比以前大了很多倍。以前做人工智能基本上是请一些专家录入数据写一些简单的规则,现在都海量的数据,包括互联网数据。

第二,计算的能力大大发展。以云计算为代表的计算能力使人们在训练或实施时不用再担心。以前的 PC 机能力非常有限。

第三,所谓的深度学习技术,实现了点对点、端对端的训练。你需要做的就是掌握并整理标注的数据,放到深度学习框架里面,它自动学习,自动抽取课程完成你所需要完成的任务。这使得机器学习的门槛大幅度下降,人工智能可以走向平民化,很多领域都可以用人工智能实现。

此外,还有重要的一点,就是落地的场景,这是过去两次浪潮都没有的。过去都是套用系统,做一些小游戏、小玩具,比如做一个小问答系统。而现在的人工智能是有实实在在的应用场景,比如说现在亿万网民都在使用的搜索引擎背后就有很多人工智能的系统;自动驾驶汽车从感知到认知都用到了很多人工智能技术。

  

wzatv:微软亚研院副院长周明:口语机器翻译在未来肯

(微软亚洲研究院副院长周明博士)

这个场景有什么好处呢?一开始技术是有限的,能力是有问题的,随着越来越多人将其作为刚需使用,自然而然提供了海量的反馈,整个系统就可以不断提升。比如说搜索引擎,网民使用搜索引擎实际上也在帮助搜索引擎训练。

自然语言处理技术的概况

人工智能是用电脑来模拟和实现人类的智能,而人类的智能大概分如下几个层次:运算智能、感知智能、认知智能以及最高一层的创造智能。其中,自然语言处理技术主要属于第三层认知智能这一部分。

  

wzatv:微软亚研院副院长周明:口语机器翻译在未来肯

自然语言处理是体现语言智能重要的技术,它是人工智能一个重要的分支,能帮助机器分析、理解或者生成自然语言,实现人与机器的自然交流,atv,同时也帮助人与人之间的交流。

自然语言处理包括以下几方面内容:

第一是 NLP 的基础技术,围绕不同层次的自然语言处理,比如说分词、词性标注、语义分析做一些加工。后面做任何其他新的技术或者应用都必须要用到基础技术。

中间这块是 NLP 核心技术,包括词汇、短语、句子、篇章的表示,大家所说的 Word Embedding 就是在研究不同的语言单位的表示方法。它也包括机器翻译、提问和回答、信息检索、信息抽取、聊天和对话、知识工程、语言生成、推荐系统。

最后是「NLP+」,仿照「人工智能+」或「互联网+」的概念,实际上就是把自然语言处理技术深入到各个应用系统和垂直领域中。比较有名的是搜索引擎、智能客服、商业智能和语音助手,还有更多在垂直领域——法律、医疗、教育等各个方面的应用。

从四个方面介绍 NLP 的进展

首先介绍机器翻译的进展

微软这两年在机器翻译上有了新的长足的进步,首先是在语音翻译上全面采用了神经网络机器翻译,并拓展了新的翻译功能,叫做 Microsoft Translator Live Feature(现场翻译功能),在演讲和开会时,实时自动在手机端或桌面端,把演讲者的话翻译成多种语言。

  

wzatv:微软亚研院副院长周明:口语机器翻译在未来肯

这张图概括了神经网络机器翻译,简要的说,就是对源语言的句子进行编,一般都是用长短时记忆 LSTM 进行编。编码的结果就是有很多隐节点,每个隐节点代表从句首到当前词汇为止,与句子的语义信息。基于这些隐节点,通过一个注意力的模型来体现不同隐节点对于翻译目标词的作用。通过这样的一个模式对目标语言可以逐词进行生成,直到生成句尾。中间在某一阶段可能会有多个翻译,我们会保留最佳的翻译,从左到右持续。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容