首先,最重要的,智能算法去做智能分发的核心逻辑是什么?这个因为今天一个是时间所限,咱们不是技术论坛,我会尽量减少技术细节的介绍,介绍基本的逻辑。 信息分发利用智能算法来做基本逻辑就是打分器。输入用户的兴趣标签,你是对数码感兴趣还是科技,你是对某一款数码相机感兴趣,你喜欢奔驰还是宝马,这是兴趣标签。 第二个维度情景维度环境特征。你在办公室,还是在家,是休息日还是工作日,是早晨还是晚上,还是说去了一个你从来没有去过的地方,你可能在出差还是旅游,这对于找到你当时兴趣都是有帮助的,这一类我们归为情景维度。 第三类维度是打分器的输入,最重要是内容维度。推荐给你的内容候选,它讲的是什么,主题是什么?热度怎么样?哪些人群比较受欢迎,是财新网发的,还是 21 世纪经济报道发的,这些都是有用的。这三种数据进去最后输出一个数,你喜欢这个内容的概率。这个最简单的函数,这个函数的工程实现非常复杂,但是它的逻辑可以很简单用这样一个函数概括,有这样一个函数任何人来了我们知道他的情景信息,我们可以把几百万的内容库看一遍,哪些分比较高,分高的就给你,机器逻辑非常简单。
我们有这样一个打分器,输入怎么来,人的内容怎么来?假设我们了解一个内容的语义标签,这个人经常看这类东西,这个标签就有分;你老给他推荐,他不看,这个分就是负分。这是快速的工程实现,稳定性,数据积累的速度。 但是这个基石其实是内容标签怎么来?我们分别讲一下怎么用人工算法帮助我们提取内容的标签,这块分成文本内容的分析和图片的分析,文本内容也是函数,你给它一串字符串,机器你就是一串字符串,来了之后第一个提取关键词,第二个把它分类,分类在大的内容推荐引擎里面,内容分类很复杂,可能有几百个、上千个,一层一层的。顶层可能是科技、财经,在财经里面有股票、宏观经济,在股票里面有美股、港股。我们还要抽取实体,这个实体对推荐人很重要。
图片也是类似的原理,拿到图片我们也要分析,图片标签和文本标签我们一起使用,做一个内容的推荐,包括视频标签也可以从一帧一帧图片中抽取一些有意义的信息。对于反作弊行为,包括识别广告和色情内容,图片分析也非常重要。 在信息分发核心流程里智能算法的应用案例,我介绍几个我们正在做的、未来机器在创作环节可能做的事情。我们有一个写稿机器人,在里约奥运期间测试上线,奥运期间这个机器人自动发了 100 多篇稿件,累计阅读超过 100 万,它很多稿件的点击率比同样的话题的记者写的点击率还高。
另外一个可以做的,就是视频的封面自动选择。今年算是短视频的爆发之年,短视频又是一个风口。怎么选一个好的封面很重要,在平台上的推荐效果方面,不同封面对点击率影响非常大。这块人去做可能完全凭经验,我们想能不能靠机器做这件事情,我们根据有经验人的行为,学习到这个模式,提供一些建议,给你一些候选,最终的决策权在作者自己手里,因为你对你自己的内容更了解,你不仅要考虑点击率,你可能要考虑你的调性,是不是符合你受众对你的期待。 另外做的有趣的事就是,算法自动生成视频集锦,这块也是去应对现在短视频的浪潮,有很多长视频的内容没有足够人力把它剪辑出来,把它变成适合在短视频分发平台上传播的形式,机器有可能把这件事做得更好,可以规模化,更有效率地做这件事。 我的分享就到这里,谢谢大家的时间。 图片均由今日头条提供;编辑 | 向想想 (责任编辑:本港台直播) |