作为头条而言,atv直播,那个作者讲了两个观点,一个是关于用户时间的问题,一个是内容的问题。其实关于内容问题我们做了不少事情;第二个关于用户时间的问题我们也想说,你要对比他干什么。我觉得我们在对广大用户获取信息的满足以及满足信息效率提升上还是做了很多工作。 骆轶航:满足人们快速获取信息的要求以及基本的安全性,安全性在于,我该知道时你得让我知道,前提还得是我感兴趣的。 张一鸣:对。不仅是文字,包括图片、视频。 骆轶航:图片和视频现在怎么能够做到精准判断和识别?我们知道文字通过语意分析、语意处理,通过看标题、看文章,能够知道放到哪个分类里,视频怎么做到精准推算?也是通过文字的方式吗? 张一鸣:首先要解释一下,外行看内行会觉得他们就是这么干的,其实很多时候不是这么干的。对于推荐而言,最主要的不是文字、视频的特征,而是通过用户行为识别。 骆轶航:他都没有看这个视频,但因为我看了,张一鸣看了,它就跟科技相关;如果我看了,“改变潮水的方向”那位看了,那它就和文学相关、文艺相关。 张一鸣:如果机器能理解内容,它可以满足冷启动,没有人看之前我就知道它和科技、和创业相关。我们会识别关键帧,也会解析音频,但最终效果的天花板还是用户行为,这是最最重要的。 骆轶航:有一个人看了,然后分析这个人的画像和图谱,识别这是什么内容。 张一鸣:可能很多人脑子里会想有个机器人,它去理解视频,其实是用户行为为主。会有更多关联人看了才会识别为科技内容。所以你们要持续提高品位,帮助机器提高判断力。
今日头条能帮助主编写新闻稿吗? 骆轶航:“今日头条”如何通过人工智能和机器学习去挖掘数据,去判断已经在互联网上存在的内容属性、类别、价值观,它可能会被什么样的人感兴许,它可能有什么样的问题。但本身在内容生产方面,我们的话题是机器写作,这一点你们内部有没有做什么尝试?坦率地说,我们计划做一些小的尝试,但我们毕竟不是技术驱动的公司,或者目前还不是技术驱动的公司,我们可能也会希望借助一些数据支持,如果你们做了,某种程度上你们就变成了生产平台。但我判断你们应该是擅长做这件事的,因为你们可能会对于机器写什么更有判断,你们怎么看这个事? 张一鸣:我们确实做了这个事情,奥运期间我们有一个实验室,他们做了“体育报道机器人”,奥运期间它大概发了 500 篇报道内容。除了体育之外,财经也合适,所以我自己总结,所有基于数据的财报解读,从把财务数据变成系列化的内容,包括从社交网站上摘引评论,这是机器能够做,而且做得还可以的。基本上那些报道两秒就生成了,准确,数字不会错,比如财报,不会有基本的金融知识错误。但是在其他创造性内容上我觉得是不行的。
在此之外有一点很有意思,一个叫机器直接创作,一个叫机器辅助创作,在设计领域已经比较多了。CAD,机器辅助创作,创作更复杂的内容。文章还好,但电影比文章复杂,游戏比电影复杂,因为情节会变化,机器辅助创作,讲那么多人物设定你怎么记得住呢?所以机器能够做到辅助创作,甚至在写到某情节时它会说“这种情节下一般有几种走向”,可能帮你预测读者对走向的喜好。 我知道起点的主编会教作者,“你千万不能让主角死了”,或者“你千万不能让主角改嫁”,这样你的读者就会下降。这部分可以让机器辅助。 骆轶航:机器可以创作最简单的事实和数据类;机器可能会创作一些复杂情节的、有故事性的剧本。 张一鸣:刚才你说统计用户兴趣词组,其实我们可以反观。 骆轶航:我们还在做社交图谱和社交热词的预测,现在都在做。 张一鸣:你可以反观,人脑活动在创造复杂事情时是非常复杂的,这种程度现在机器还是到不了的。 骆轶航:最后两件事,第一,我还得问你两个问题,“今日头条”作为机器学习的工具,现在有 AI 驱动,机器判断人懂什么的阅读工具,它能不能满足你所有的阅读需求? (责任编辑:本港台直播) |