极客公园微信号:geekpark 头条问答
2016 年,已经酝酿良久的知识分享终于呈现出了爆发式发展。除了在这个领域深耕多年的知乎和果壳分别以不同形式实现了产品形态和商业模式上的突破之外,包括百度、微博、喜马拉雅等更多的力量开始突围。就在今年,这其中也出现了今日头条的身影。 今年 4 月,atv,今日头条的头条问答栏目正式上线。这个聚集了 6 亿用户的内容分发平台似乎在各个角度上,都与人们定义的「消费升级」前提下的知识付费浪潮调性不符合,但是在 11 月的世界互联网大会上,今日头条 CEO 张一鸣曾经这样介绍过头条问答的机制:「传统意义上的问答基本上都是基于社交模式,存在很多问题,在我看来这恰恰是人工智能和算法可以解决的。」 也就是说,在依托于今日头条的头条问答上,算法可以帮助用户在 6 亿用户和 30 多万个「作者」中找到最适合回答某个问题的「专家」,也可以把最「合适」的问答内容推送到最需要阅读他们的人。更关键的是,今日头条还希望未来算法可以根据热门事件自动生成问题:在头条问答上,你大概不会看到类似于「谢邀」的寒暄,因为回答这些问题的「邀请」大多数是由机器发出的,甚至问题和答案都是由机器提供的。 看上去这又是今日头条基于「效率先于价值」推出的一款产品。能够支撑起这套系统运行的则是用户留存在今日头条上的海量数据分析,以及这家公司一直视为生命根基的人工智能算法。 用算法驱动的问答社区到底什么样? 用今日头条算法构架师曹欢欢的说法,头条问答关注的是「更广泛的问题」,「我们希望这上面有很专业的问题,但是我们覆盖的是几亿用户,所以也会覆盖到一些并不专业、但是用户有需求的问题,总的来说我们在覆盖面上有一定的优势。」 打开今日头条的问答频道,你会发现这里人们关心的问题和知乎不太一样,调性也更加「接地气」。你可能看到的是类似于「俄罗斯大使在土耳其安卡拉被杀会造成哪些影响」这样的专业性问题,也有可能看到「李小璐为什么会嫁给贾乃亮」之类的八卦分析,发生这一切可能性的前提,都要看你平常是如何「调教」今日头条 app。
一个完全没有被「调教」的头条问答频道 不过就现阶段来说,这个用机器驱动的问答系统并不成熟,它还不能很好的完成「个性化分发」的任务。相比于今日头条上的内容分发,头条问答的内容分发是比单纯的新闻内容个性化推荐更加复杂的领域,因为它涉及到的不是「内容和读者」两方之间的关系,而是扩展到了「问题、答案、读者、专家」等更多维度的关系。 具体到问答领域的难点,曹欢欢认为可以总结为以下六个方面,分别是: · 问题分发:如何为用户的提问快速找到最适合回答的专家,并且提供高质的回答。 · 答案质量:是否很好的回答问题,其中包括能否有效处理答非所问、答案配图无关等问题。 · 答案排序:在同一问题下,机器能否给出比较好的答案排序,该排序对浏览用户和创作者是否都比较友好。 · 问题配图:用户提问的时候,系统能否给出合适并且优质的配图候选。 · 问题自动生成:碰到一些热门的新闻或者用户津津乐道的话题时,系统能否快速的自动生成问题并且配以生动的描述。 · 问题去重:对于重复的问题,机器能否聚合,怎样做到高准确的召回。 知识表示、推理和内容分发领域涉及到深度学习、概率图模型、矩阵分解和稀疏方法、决策树等理论和技术。而关于现阶段如何更好的解决这些技术难题,今日头条的方法是把头条问答上的数据开放,以实际问题作为题目举办一场算法比赛。 事实上,用算法大赛驱动算法和实际问题解决方案的进步一直是科技界的传统。其中最著名的应该就是 2006 年 Netflix 在举办的百万美金 Netflix Prize,就曾经为该公司带来过包括算法、人才和品牌价值上的丰厚回报。其中在业界,这次大赛带来的最直接影响就是关于「推荐」算法上的突破性进步。 (责任编辑:本港台直播) |