刚刚讲的是第一种新闻编辑和摘要的产生,第二种我认为有希望的方向是信源捕获。什么意思呢?我们可以在一个新的领域利用新的手段获得一些信号,并且把这些信号转变成我们要的新闻内容。在这里举几个例子,首先是假设我们有很多的文章,可以自动地把这些文章给产生成一些问题和答案的配对,也就是问题和答案的集合。这就像我们理解了一些过去某个政治人物或某个著名人物写过的文章或关于他的文章,以后自动产生一些想要问他的一些问题,这个过程是需要人去理解文章,然后产生一些高质量的问题。 今天我们可以用深度学习来做到这一点。这是怎么做到的呢?这是两种信息的结合,一种是知识库,也就是对整个领域的认识。另外一种就是文本。我们把这两种结合起来,就可以自动地生成一些挺不错、质量挺高的一些问题,就好像我们下面就可以去面对这位被访问的人物了。 这也可以延伸到从文字到图片,比如看了一个图片,现在也有一种方法可以利用计算机神经网络抽取出特征,用另外一个模型来产生问题。也就是说对着一个图片,可以产生对于这个图片的问题。这个问题也就变成了这个图片的一个标注,或者可以到外面去邀请别人来回答这样的问题。 假设今天有了很多的传感器,可以把传感器收集的数据、信号自动转变成人可以去读的文章,比方说我有一个学生很热爱骑马,它造了一个传感器可以放在马尾巴上去观察马的健康状况,同时可以把它翻译成人可以读懂的信号,以此来了解整个赛马的成长过程。 进一步就是想把传感器放在宠物的身上,在宠物的日常活动当中和人的交互当中,可以把宠物的行动变成人能读懂的自然语言,就好像宠物在跟你用说话的方式在交流一样。 我还有一个学生在用手机作为传感器来记录用户每一天的行为,到晚上的时候就自动把所有收集的手机信号转成一个自然语言的日记,把这个日记给这个人,可以修改一下,也可以发朋友圈。 还有一个方向是信源可视化的追踪,比方说我们有了很多社会网络,里面有很多的信息的传播、新闻的传播,通过可视化可以观察到这个传播的路径、地点和传播的方式,可以根据人群来细分。同样一个新闻内容,我们就可以对不同的人进行不同的服务。比方说小朋友得到的内容,可以和成年人得到的内容形式不一样,但是基本内容都是一样的。这样可以自动化个性去投放。 还有一个方向是视频和资讯的一种互动,这方面的数据量是庞大的,边界也足够清晰。但是一个重要的问题是跨界的人才特别少,我指的这个资讯和 A.I. 的互动到底是什么呢?比方说很多的视频,能不能有能力让计算机看这种视频,然后用文字的形式告诉我们,给我们一个文字的摘要。像这样的是我们的一个梦想,这样就可以自动地去检索很多的视频,自动地去搜索,可以找到我们想要的视频。 另外一些新闻视频也可以帮助编辑去找到他们人为的高质量的适合编辑内容的视频,这个事在大学的实验室里面已经有很多的尝试了。其中一个方法是把视频通过深度学习转化成特征,然后在通过这些特征再转化成文字。从视频到文字,甚至可以从文字到视频,你可以描述一个像电影的脚本一样,然后自动地一个通过拼接的方法产生一个可能的视频。这方面还有所欠缺,关键点是跨界的人才和用户的反馈还不够多。 大家关心的另外一个方向是智能分发,这个新闻怎么分发到想看这个新闻的用户的手里。在过去这个方向叫做推荐系统,在电商里面已经大量地使用。但是新闻有它的特点,因为新闻是靠内容来取胜,所以一定不能忽略信息的内容。比方说我们人看新闻,是因为我们好奇,对于新闻感兴趣,怎么样能够把好奇的人和好奇的内容给结合起来,怎么能把桥梁给建立起来。比方说一个用户带历史上经常读一些财经的文章,现在又比较关注美国大选,能不能以此来推断他关心的就是特朗普对财经的政策,以此可以推送很多这样的新闻。这种信息既有用户的行为信息,又要有内容的信息,像这种的结合现在已经开始有这方面的研究了。 (责任编辑:本港台直播) |