本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

wzatv:【组图】专访 | 搜狗+NMT+团队:神经机器翻译将消除跨语言沟通障碍(3)

时间:2017-01-23 19:54来源:天下彩论坛 作者:j2开奖直播 点击:
翟飞飞: 我个人觉得是可以的,比如现在有各种各样的工作用来自动生成训练语料,但具体怎么操作,还要针对不同的任务,生成的数据能不能拿来使用

翟飞飞:我个人觉得是可以的,比如现在有各种各样的工作用来自动生成训练语料,但具体怎么操作,还要针对不同的任务,生成的数据能不能拿来使用,也需要经过评测之后,才能判定。。

机器之心:搜狗的 NMT 有应用在外部的对准模型吗?

翟飞飞:外部对准模型是一个相对比较通用的技术,我们也在使用,同时也在探索其他的相关技术。

机器之心:在哪些具体场景,搜狗 NMT 的表现会比较好?

许静芳:搜狗的机器翻译整体来说有非常好的调序能力,翻译译文流畅,利于理解。英文我们利用翻译的主场景是跨语言检索,所以书面语言的翻译效果比口语还要更好一些,英翻中比中翻英效果的领先优势更突出。

四个月上线,搜狗翻译打通华语世界与英语世界

机器之心:这次根据机器翻译推出了海外搜索,国内获取英文信息一直是非常困难的事情,川总在演讲中也提到过这个。用先进的机器翻译技术切入这个刚需变成产品,而这个产品又会因为用户频繁使用来产生更多数据并优化技术。这可能是我们目前所看到的机器翻译技术最恰当的产品形态。当初我们是怎么想到这种产品思路的?以及海外搜索和机器翻译的良好互动将实现什么样的一种目标?

许静芳:海外搜索的前身叫英文搜索,是 2016 年 5 月份发的一款产品。有几个背景,首先全世界的信息 10% 是中文,90% 是英文。不管是国情还是文化,英文的质量在某些领域是明显高于中文的质量,并且平均水平还是高于中文的水平。其次国人随着各方面的进步,有非常迫切打开眼界与国际接轨的需求。世界是平的,有这样的需求存在。

搜狗 5 月份发布英文搜索是让用户搜索更优质的英文内容。由于各种原因,国内并没有特别好用的英文搜索,搜狗英文搜索是将优质的英文信息引入,给大家提供这样的入口,才能接触到这样的信息。在 5 月份上线的时候就附带一个小的功能,举个例子,在爆发魏则西的事件的时候,大家要查滑膜肉瘤,查细胞免疫疗法,大家知道中文的概念,而且也明白,更权威性的信息与知识在国外。但是当用户在用搜索英文信息的时候,首先遇到的第一个门槛就是不知道如何用英文拼写出」滑膜肉瘤」,」细胞免疫疗法」。

所以搜狗英文搜索当时就有一个功能是允许用户用中文查询词,通过机器翻译自动翻译成英文查询词,再找到英文信息。当时面向的用户,是英文相对还可以,但在一些专业术语上需要补足的用户,尤其在不太熟悉的领域,构建英文表达很困难。但是如果返回英文结果,能读懂但比中文结果要困难。

这个功能上线以后,在这个主打英文语言的搜索频道,中文的查询词占 20% 以上,而且随着时间的推移,还在逐步的提升。可以说这样的功能是很受用户欢迎,所以我们想把目标用户范围扩得更大一点,英文水平再差一点的同学,也能帮助他去阅读。进一步想法:把搜索结果能够翻译成中文,让不懂英文的用户在这里基本能看懂;懂英文的,借助机器翻译,也能更快到去找到他想要的信息。所以海外搜索的想法是在英文搜索发布不久,就已经萌生出来的,只不过翻译很难,搜索也很难,要把这两件事结合在一起,是难上加难。我们在英文搜索发布之后,大概花了四个月左右的时间,在建立团队的基础上,首先构建自己自主的机器翻译的能力,而且机器翻译的第一场景就是跨语言检索。

机器之心:现在有很多企业都和高校实验室建立了非常紧密的合作关系,能介绍下搜狗在 NMT 上和清华大学的合作吗?

许静芳:这是非常成功的校企合作的案例。2016 年搜狗捐赠清华大学打造天工智能计算研究院,机器翻译也是天工智能研究院下面的第一个合作项目,将搜狗的技术能力与清华刘洋教授的机器翻译团队的长期积累相结合充分发挥两个团队各自的优势,最终也取得非常好的效果。机器翻译的技术门槛很高,业内很多团队做机器翻译都是一年以后上线,或者两年以后再上线的,我们其实只花了四个月,这也体现搜狗在人工智能上的优势与决心。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容