本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

报码:探访:微软是怎么做机器翻译这件事的?

时间:2016-08-29 04:15来源:香港现场开奖 作者:开奖直播现场 点击:
必须承认,虽然之前参加了许多次的产品/技术介绍活动,也看了不知多少次的Demo演示,但微软翻译(MicrosoftTranslat

必须承认,虽然之前参加了许多次的产品/技术介绍活动,也看了不知多少次的 Demo 演示,但微软翻译(Microsoft Translator)在上周给出的演示效果还是让我吃了一惊:同声传译们要小心了,微软的这个新功能真的可以威胁到你们了。

事情是这样的:

瑞典有一个移动运营商,它应用微软的语音翻译的 API 集成到他们后台的通信网络系统。于是乎,除了对方本人的说话声音之外,两个说着不同语言的人可以在打电话的时候直接听到手机里传过来的翻译的声音。由于这个功能是集成在通讯系统里面的,所以用户直接就可以获得这个功能,不需要下载 App。

在当天的演示中,微软的两位同事分别操着英语和法语互相打了半天电话,两人通过手机里传过来的翻译声音,基本理解了对方的意思。

如果说自动驾驶汽车让司机们感到了生存的危机,那微软的这个演示恐怕会让很多翻译和同声传译们心头一凉:机器的触手已经伸到我们身边了。

探访:微软是怎么做机器翻译这件事的?

微软翻译在内部的应用范围

重视企业级用户

谈到机器翻译这个领域,大家的脑海中可能会浮现出微软、Google、百度等大公司的身影。其实在过去的很多年中,人类一直在探索这样的技术。在过去五年左右,这个技术取得了重大突破,到今天虽然还不够完美,但是已经能够应用到真实的场景中了。

相比其他公司,微软在机器翻译领域最大的特点就是把重点更多地放在了 B 端企业级用户上,这点也秉承了微软整体的产品策略。毕竟,自从纳德拉上任之后,他提出的「移动为先云为先」的策略也决定了微软必须将重点放在 B 端用户这一边。

Microsoft Translator 是基于云计算开放的 API 技术,从 2008 年开始,这项技术首先被用在微软自己的产品里面,包括 Office 和必应等。到 2011 年,微软开放了 API,让第三方用户也能够接入使用这个技术,达到和微软产品一样的翻译结果。目前,Microsoft Translator 已经服务于全球上千家企业客户,包括亚马逊、eBay、Twitter、惠普、戴尔等。

探访:微软是怎么做机器翻译这件事的?

目前他们的 API 包括两个,一个是文本翻译,atv,一个是语音翻译。现在微软开放的主要是文本翻译,那数千家客户使用的也大都是这个部分,而语音翻译由于技术才完善不久,直播,其 API 于今年 3 月才刚刚开放。

在谈及自己在企业级用户方面的优势时,微软研究院 Microsoft Translator 产品战略总监 Olivier Fontana 提到了三点:第一,重视企业级用户,为他们提供了很可靠的解决方案;第二,产品可定制,能根据不同的行业定制不同的语料库;第三,扩展性好,比如他们最近增加了 Microsoft Edge 浏览器的翻译拓展功能,如果用户安装了 Windows 10 的周年更新版本,那他就能使用这个浏览器翻译功能了。

语音翻译是新的发展方向

现在,我们来着重谈谈微软目前重点发展的方向:语音翻译

事实上,对于我们一般用户来说,我们目前大量使用的还是文字翻译。不管你是文字输入还是拍照,你所进行的基本都是文字之间的互通。但事实上,语言总是要靠声音「说出来」的,我们最终还是要回归语音交互的道路。

(2012 年微软语音机器翻译实时演示的场景,很有说服力)

按照我们一般的理解,语音翻译的大概流程就是「听到声音-变成文字-翻译-从文字再变回声音。但根据微软的测试,这样的方式其实效果并不好。

微软的做法是这样的:自动语音识别(ASR)-TrueText(智能文本校正)-自动文本翻译-文本到语音转换(TTS)。其中最关键、也是让语音翻译这个过程脱胎换骨的环节有两个,第一个就是 TrueText,另外一个则是大量基于口语的语料库。

探访:微软是怎么做机器翻译这件事的?

TrueText 的作用很简单,就是把不是特别规范的口语进行调整,变成更容易理解和翻译的文本,比如「啊」、「嗯」、「这个」、「那个」之类的。此外,微软还建立了大量口语化的语料库充实到文本翻译中,根据他们自己的说法,微软是目前唯一一家添加了语音数据库的公司,这种口语化的翻译模式让语音翻译听起来更加自然。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容