本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

wzatv:【j2开奖】思必驰首席科学家俞凯:深度绑定研究和产业问题(2)

时间:2017-05-25 00:57来源:118图库 作者:开奖直播现场 点击:
未来自然语言的信息交互,它是以口语通道为主,辅以其它通道。从这个角度上讲,未来的方向从我来看,有两大部分:一部分是通过以 深度 学习为主的

  未来自然语言的信息交互,它是以口语通道为主,辅以其它通道。从这个角度上讲,未来的方向从我来看,有两大部分:一部分是通过以深度学习为主的方式来解决语义本身的表达和分析,当然这也包括知识的表达和分析;另一部分就是解决交互问题。交互是一个新领域,在过去 10 年,才逐步得到大家的重视,交互要做的就是让机器可以像人一样去做决策。

  机器之心:深度学习的出现,给自然对话领域带来了哪些改变呢?

  俞凯:最大的改变就是可以用大数据自动提取一些上层的抽象的特征,能够使得传统的自然语言处理的任务,在深度学习框架下,性能得到非常大的提升。这个改变意味着在传统的科学范式里所要解决的几类机器学习问题,几乎都可以得到比较好的解决。举个例子,比如说分类问题,比如说回归问题,只要你能把它,我们叫 formulate,就是把这个问题变成这两种格式,那么采用深度学习,再加上辅助有比较大的数据量,几乎都可以很好地解决,相当于提供了非常厉害的通用方法。

  机器之心:NLP 领域要继续发展,应该去探索哪些新的方法?

  俞凯:深度学习的潮流,从现在来看种类越来越多。它的意思是,大主流可能还叫深度学习,但它里面出现了很多新的小的分支。不再是像以前以神经网络为主要方法,以大数据为主要的燃料,主要方法加上燃料,它就能造出很多很好的结果和火花。

  第一个例子就是关于迁移学习和深度学习之间的关系。深度学习是需要大数据的,传统的问题范式下,它能解决得很好。在很多时候无监督的时候,你是没有标签的,或者说你只有很少量的标签。在你已经区分了男人和女人之后,我下面再让你去区分小孩和女人,怎么去区分?这个时候就可能是要解决一个,既有很大量的数据,但又不满足传统问题范式,或者是你又要去到一个新的领域,那个时候迁移学习和深度学习的结合就变得很重要。

  第二个例子就是现在的深度学习,已经比较好地解决一些问题,主要还是大数据驱动。但随着我们越来越向认知这个方向去进发的话,知识和数据的联合驱动就变成一个特别明显的方向。像这样一类新的范式,它都会使深度学习本身又产生很多小的分支,不再是单纯的深度学习,而是在我们解决问题的方法上,甚至是在我们发现问题的方法上有非常大的变化。

  机器之心:GAN 和强化学习结合来做序列产生是最近研究的一个热点,被视为 GAN 进入 NLP 的一个开端,请您谈一谈 GAN 在解决 NLP 问题上的前景和挑战。

  俞凯:实话实说,我到现在为止没看到很成功的 GAN 的例子。

  自然语言是一个序列,那么之前 GAN 它是放在图像的生成上,放在自然语言序列上面的话,就需要满足序列生成的一些特定条件。因为自然语言处理是一个离散的东西,它不像 image,它是个连续的值。比如说一个 density,那么它的灰度 156 和灰度 155,这两个肯定是接近的。但如果放在自然语言处理里,虽然可以把它向量化,但很难讲那个向量里面,156 这个值和 155 这个值在语义上或者是在其他的语言学的度量上,它是接近的,很难很难去规定。所以从现在看到的实践结果,GAN 有一些结果,但都不是在主流任务上面,所以对 GAN 是不是能很好的应用,我本人还是打了问号。

  未来 GAN 要产生影响,至少从我的观点,自然语言处理中,如果要有巨大的飞跃,那么先验知识的放入是不可避免的。而如何比较巧妙的用少量的先验知识结合无监督的大数据,或者是在这个先验知识本身的结构形态上面,有很好的深入的通过机器学习的方式做解构,这个可能是未来能够产生突破的一个很重要的方向。

  机器之心:完全数据驱动的端到端训练方法是目前流行的解决方案,但完全脱离先验知识或者其他相关资源似乎并不可取,您如何看这个问题?

  俞凯:首先我不认为端到端是个趋势。就算有很多人都同意,我自己的学术观点就不是这样。很简单的道理,你看一看现在真正业界用的系统,有谁敢说是完全端到端的。端到端最大的问题,最大的好处是,你不需要去设计中间每一个模块的架构,它可以使得你用统一的架构去解决一个问题。

  这就使得在简单的大数据驱动框架下,它能够做得很好。但假如你所面临的这个任务本身它是需要可解释的,它甚至是需要可调整的,那么端到端它只给了你一个黑箱子,可能很难去调它,而自然语言处理恰恰是这样一类问题。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容