Facebook近 10年来一直沿用其Newsfeed功能实现个性化推荐。2006年9月份,NewsFeed(信息流) 问世,开奖,同时问世的还有MiniFeed(个人动态)。NewsFeed是一个系统自动整合生成的内容信息流,它自行来决定我们读到哪些新闻、动态、事件。它所覆盖的范围,其信息推送的精准度,以及其影响力远超过我们的想象,可以说NewsFeed是Facebook在人工智能上所走的一大步。 Facebook是如何利用深度学习来评价内容和用户的呢? 第一,在检视文本方面,Facebook 使用“自然语言处理”技术来扫描每个人发的“状态”和“日志”,以便“真正理解文本的语义“,不仅如此还要将它们评级。日志在扫描的过程中,系统会自动识别出“过度标题党”或者“过度商业化”的内容,而且这样的内容在 NewFeed 里面是越来越少见到了。 第二,在内容翻译上,当在处理非英语的语言时,Facebook工程师专门开发了一个深度学习平台,每一天会对 100 多种语言所写成的文本进行分析,翻译。比如当一个朋友以德语发表了一条动态时,NewsFeed会以英语体现出来给一个美国的朋友,营造了一个能够跨过语言障碍的,人人实现互联互通的数字虚拟环境。 第三,在识别物体方面,Facebook 也在利用深度学习技术来识别照片和视频里面的物体,不仅如此,它还能进一步地去探究谁有可能对这些照片感兴趣,或者这些照片跟哪些用户相关联,从而推荐给目标用户。 (三)深度学习之困境 深度学习能打遍天下无敌手吗? 至少目前来看,深度学习只是在Speech和Image这种比较“浅层”的智能问题上效果是比较明显的,而对于语言理解和推理这些问题效果就有点失分,也许未来的深度神经网络可以更“智能”的解决这个问题,但目前还差点火候。 深度学习在推荐系统领域的研究与应用还处于早期阶段。即使深度学习被认为能够解决协同过滤的冷启动、数据处理较慢的问题,但是风光之下,它也有自己的难言之隐。 第一,成本太高。数据对深度学习的进一步发展和应用至关重要。然而过分倚重有标注的大数据也恰恰是深度学习的局限性之一。数据收集是有成本的,而且标注成本已经开始水涨船高,这就使得深度学习的成本过高。而且对于体量较小、数据较少的众多小公司来说,即使有能力用深度学习改善个性化推荐结果,也面临着没有数据支撑的尴尬境地。 第二,降低成本的方案有没有?有,但是难以实现。深度学习分为有监督学习和无监督学习,大量无监督数据的获取成本却是微乎其微的。目前一般用的都是监督学习,但本质上基于监督学习的大多数推荐模型都很难彻底规避现存问题从而提高推荐质量。无监督学习由于无需对数据进行加标签等原因成本较有监督学习较低,但目前深度学习对无监督数据的学习能力严重不足,因此深度学习在推荐系统中的应用仍处于早期阶段。 新老派两大力量相互抗争、相互促进但又相互交融。传统推荐技术在深度学习的冲击下不断完善,深度学习带着赶超传统推荐技术的强势劲头不断革新但也面临着发展窘境。但正是在多个平台的这种自我发展和革新的过程中,新老派的界限也变得越来越模糊,越来越走向融合。即使坚持完善传统推荐技术的公司也开始慢慢涉足到深度学习的领域中,深度学习发展较为成熟的新派也并没有完全摒弃老派技术,那么,未来到底何派为王? 四.未来鹿死谁手? 内容C2M,本质上是对人心的一种洞察和预测。技术与人心的斗法,并非一朝一夕便能奏功。人类思想的根本特征在于“意识”,即个体理解自己与他人的心理状态,包括情绪意图、期望、思考和信念等,并借此信息预测和解释他人行为的一种能力。 但是,当前的人工智能领域中存在着一个很严重的问题:人们误解了深度学习模型的工作机理,并高估了网络模型的能力。 通过深度学习,我们可以训练出一个模型,它可以根据图片内容生成文字描述。这个过程被视作机器“理解”了图片和它生成的文字。当某个图像存在轻微改变,导致模型开始产生相当荒谬的字幕时,结果就会让人非常惊讶—模型失灵了。机器能找出一只猫,但机器仍然不能识别跟猫相关的所有信息。 (责任编辑:本港台直播) |