本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

wzatv:【j2开奖】专访香港科技大学教授杨强:国内的人工智能研究不能太跟风(4)

时间:2016-11-22 11:28来源:天下彩论坛 作者:118KJ 点击:
这种表达通过第二种模型,也就是说我们所说的机器学习、自然语言的生产模型,能够为我们人产生出各种各样的我们所需要的数据。就好像我们旁边有一

  这种表达通过第二种模型,也就是说我们所说的机器学习、自然语言的生产模型,能够为我们人产生出各种各样的我们所需要的数据。就好像我们旁边有一个助手在我们帮助进行了大量的阅读,然后根据我们每个人的需求可以跟他进行对话来获得他阅读的知识,所以是这样两个过程。一个是机器阅读系统,一个是自然语言的生成系统。

  机器阅读有哪些应用呢?比方说在谷歌的邮件中就可以通过模型对大量邮件的阅读形成一个端到端、序列到序列的模型,这个模型通过阅读一个新的用户邮件,自动地产生一个可能的用户反馈,这样用户在给最后一个决策就可以很简洁地恢复邮件,这样就大大提高了用户的体验。

  机器翻译就不用说了,这是非常有用。但是最近深度学习的发展,可以让机器能够自动地用算法学习到一种语言到另外一种语言,可以自动对应。这种对应在之前是很少的,但是用机器学习来做就大大增强了。它的效果是可以使注意力机制大大加强,什么叫注意力机制呢?就是在一句话里面哪些部分是关键部分,我们可以拿这些部分来代表整个话的意思,这样可以用聚焦的方式来加强理解。应用了这个以后,比分就大大提高了。

  还有一个应用可以让计算机去做很多阅读,阅读的结果可以由我们人来询问。比方说让他看了一个语文的试卷、历史的故事,我们可以问一些关于历史人物、历史事件的问题,计算机可以圆满地做出回答。

  还有一种就是我刚才说的注意力机制,可以帮助人描画出哪些文本的部分是我们阅读者应该去注意的,就好像我们学生在上课的时候经常会画一些需要关注的重点,这样我们考试的时候就会有的放矢。机器在今天已经会做到这一点了,这个叫做完形填空的回答。

  这个再发展下去,又可以让机器大量地背唐诗,并且可以自己写诗。这里是香港科技大学的图片,图片有山有水,这个模型可以在唐诗里面选择最合适的唐诗来配这副画。同时利用生成式的模型,还可以自动地产生。比方说当输入对联上联的时候,就可以拿它作为输入,这样的生成模型可以自动产生下联,而且通过注意力的机制使上下联对仗非常公正,这在人看来都是一个智慧的象征,但是今天对于机器来说已经是非常简单了。

  我说了这么多对智媒的进化预示着哪些呢?首先我对我的观点进行打分,5 分是最高,1 分是最低。我们看看刚才讲到的 5 个必要条件,分别是数据量、边界够不够清晰/问题定义得够不够清楚、外界的反馈够不够好、计算资源是不是足够、有没有跨界人才,以此来判断这个领域的爆发力的指数。

  我们先看看在媒体方向上最关心的是能不能用 A.I. 来帮助新闻编辑室做一些人工智能的编辑,机器人的编辑助手来大大提高我们的编辑效率。在这一方面,应该说一个重要的方向是给了一个文章或文本能不能够自动写出一些摘要,给出一个文章,能不能自动地产生一个吸引用户的标题。在过去的做法,这个领域叫做摘要的编辑,摘要编辑过去的做法叫做抽取式的新闻写作。

  这里有一个例子,就是在一个足球赛里面,通过对解说词的分析,用解说词来训练一个模型,最后这个模型可以在解说词当中抽取特征。另外是再把这些重要的特征所指出的句子给摘出来,再把他们拼接起来形成一个很短的摘要。这个事已经可以做了,在过去十年、二十年已经做得不错了。但是毕竟不像人一样去读一篇文章,再根据我们的理解重新写出一个摘要,或者是编出一个非常好题目。

  如果要做到这一点,开奖,我们就需要一个所谓的生成式的模型,这个模型可以做什么呢?可以把每一句话读进来,并且可以对应到输出,这个输出往往是上文对下文的序列到序列的对应。这种对应还不足以产生我们所想要的高质量的摘要。在这个基础上,我们又在上面可以加一层强化学习或者增强学习,使得这样的摘要过程有目的性。也就是说两种学习,一种是序列的深度学习,另外一种是增强学习,这两种加在一起就可以产生基本上跟人差不多水平的一个摘要。比方说这里的一个例子,是对一个新闻的文章产生一句话的摘要。

  我们来开一个脑洞,也可以让机器去读小说,比方说有《射雕英雄传》、《笑傲江湖》,可以把这两个小说给合并起来,怎么合并呢?利用模型来合并输出一个新的小说,这个小说是《笑傲英雄传》,这个事是怎么做的?可以用循环的神经网络(RNN)来产生各自的模型。阅读了以后,产生的模型通过迁移学习迁移到一个共同的空间,这个共同的空间就是得什么呢?生成的模型可以使得我们阅读小说。比如说洪七公和令狐冲这样的人物可以进行打斗,可以看得非常通顺。这个跟人的反馈、强化学习、增强学习的机制是分不开的,也是今天大数据的一种结果。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容