本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

码报:【组图】一点资讯王元元:追着效率跑的算法如何兼顾内容?

时间:2016-11-24 21:40来源:本港台现场报码 作者:www.wzatv.cc 点击:
由CSDN 打造的年终技术盛会“2016 中国软件开发者大会”(SDCC 2016)日前在京举行。ThoughtWorks中国区CTO徐昊、Erlang之父JoeArmstrong、华为PaaS首席系统工程师俞岳、一点资讯算法总监王元元

  由CSDN 打造的年终技术盛会“2016 中国软件开发者大会”(SDCC 2016)日前在京举行。ThoughtWorks中国区CTO徐昊、Erlang之父JoeArmstrong、华为PaaS首席系统工程师俞岳、一点资讯算法总监王元元等参会并做主题演讲。

  科技边角料在大会现场发现,一点资讯算法总监王元元详细阐述了算法对个性化内容分发带来的强大助力及其存在的瓶颈,并以一点资讯为案例为在座嘉宾解读了兴趣引擎如何在流量主题不变的情况下,使效率与价值并行。

  他表示,个性化分发时代,基于海量数据的机器学习算法让分发效率显著提高,但往往算法提供的内容对用户的价值并没有相应的提高,一点资讯通过全球首创的“搜索+推荐”兴趣引擎沉淀高质量内容,并使用机器+人工的“人机智能”技术引领价值阅读,从而实现用户体验的提升。

码报:【j2开奖】一点资讯王元元:追着效率跑的算法如何兼顾内容?

一点资讯算法总监王元元现场发表演讲

  以下为主要演讲内容

  人工智能在整个内容分发行业,正在发挥越来越重要的作用。目前,一点资讯的DAU日活达到4800万,用户日均阅读20万的文章。在这如此大规模的日活和用户操作行为下,我们收集了海量的用户数据。这些数据也构成了利用人工智能技术提升内容分发效率的重要的数据基础。

  流量时代追求效率背后隐藏着价值危机

  从传统门户时代演变到现在算法驱动的个性化分发时代,流量是不变的主题。无论是流量获取,还是流量变现,效率始终是这场流量战争中的关健。

  从过去的实践中可以看到,随着用户规模的不断增加,我们使用的算法,包括特征和模型的复杂度不断地提升,可以明显地看到一点:用户的使用时长,包括次日留存率,都有一个非常稳定的上升过程。效率可以被我们定义的各种各样的数据指标来描述,比如点击率、停留时长。这些指标在一定程度上反映了用户的满意度,但是这些指标与也经常与用户体验背离。事实上,我们很难去获取用户对当前向其分发的内容的全面感受,这是算法需要优化但又看不到的目标。

  迎合人性弱点的算法推荐不利于内容价值延伸及用户留存

码报:【j2开奖】一点资讯王元元:追着效率跑的算法如何兼顾内容?

  我们选择了某个月里面的所有新增用户作为数据采集目标。经过充分的冷启动之后,根据这些用户在月末的画像将他们分为普通和高端两个用户群体,在第一个月里面,那些更倾向于关注“原配打小三”“车祸现场”等热点、娱乐八卦资讯的普通用户在停留时长上高于高端用户,也就是说,这些社会、娱乐、热点等内容在短期内吸引力远高于长尾内容但如果我们再把时间放长一点,在接下来一个月的第一天开始,普通用户在不断的流失。在第30-60日之间,留存率方面高端用户已经反超普通用户,长期来看,高端内容用户的忠诚度更高。

  这个给我们的启示就是,我们需要做一个更有价值,对于用户来说更容易满足它多元化需求的产品,不仅包括有趣、有料的爆点内容,也包括有用、有品的细分内容平台。

  那么是什么原因导致算法在获得效率的时候巨大提升,同时带来了价值的降低?

  影响算法结果的最根本的两个要素是数据和目标。

  先从数据谈起,海量数据来源于用户与内容的交互行为,海量数据不一定意味着特别高的价值,如果我们每天仅提供几十篇最热门的文章,基于一点资讯上的2.9亿用户,这也会产生海量的数据。但仅基于这些数据,效率提升的天花板非常明显,再怎么优化,用户关心的就那么几条内容。在整个优化过程中,我们需要不断引入各个领域的专家、专业知识,引导用户生成更具价值的数据,再通过算法或者模型学习到这些价值,再提供给用户。除了专家知识,也需要积极引导用户表达兴趣,完全基于人性弱点的被动反馈往往很慢也很获取到用户真正的兴趣,综合考虑了短期成本和长期收益的满足和试探机制,是增加海量数据价值的又一关键。

  算法的第二个要素是它学习的目标。算法特别擅长优化单一指标,比如点击率,atv,但事实上用户对内容有多种反馈,比如停留、分享、收藏等,当然还有一些负向的反馈,比如“不喜欢”、“踩”,甚至投诉。一个标题党的文章往往有很高的点击率,但它的不喜欢,踩也很多,只优化点击很容易让标题党泛滥,结合多种目标同时优化可以显著降低标题党的流行程度。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容