这里还有一个非常有力的例证:它的名字是 Social Recommendations(社会化推荐)。一年以前,一个 AML 工程师和 Facebook 分享团队的一名产品经理在聊天时弹起来了这样一个现象:当人们在 Facebook 上询问身边的朋友,当地有什么好吃的馆子或者其他优质服务时,人们的互动程度会很高。 但是如何将推荐信息有效地识别,并且推送到用户的时间线上呢?在过去,分享团队一直是通过「单词短语匹配」,也就是将「请求推荐的短语」和「推荐的短语」进行匹配。但是这并不一定就奏效,因为每天是有 10 亿个更新出来的,往往匹配出来的东西不准确。但是,在他们经过一番讨论之后,他们决定利用神经网络训练技术,通过把模型放到现实生活中去测试,逐渐的,研发团队能够识别出来不同的人问话之间的细微区别,不同的诉求。之后,系统可以在某个指定的区域,找到那个想要知道「在哪儿吃比较好」、「哪儿买鞋子比较划算」的人,这进一步会触发一个请求,同样也是在机器学习技术的支持下,它还能找到一个提供靠谱建议的人,然后将这个馆子或者鞋店的具体位置发送到用户 News Feed 的地图上。 对于图片和视频来说,AML 团队已开发出了一个机器学习远景平台 Lumos,它能够对发布在 Facebook 上的所有照片、视频进行理解和加工。任何人都可以在这个平台去建模,然后放到特定情境中去实践,看看它是否达到预期效果。 Lumos 的发明者之一 Paluri 给我做了一个很简单的演示。他打开笔记本,运行 Lumos 平台,开始一项机器学习领域中的简单任务:不断地提升神经网络识别直升机的能力。有一个页面上堆叠了各式各样的有关直升机的照片,如果你要滚动浏览是看不完的,要有 5000 多张。有些图片上还不能算是直升机,比如一些玩具,或者飞翔在天空,貌似直升机的飞行物,或者是老鹰。我不是工程师,更别说是一名人工智能专家了,但是我在这里却能帮助他们进行机器学习。一旦机器选错了图片,那么我就点击否定的按钮示意它错了即可。 但最终,这种依靠人力来去鉴别,辅助培训的方式要被淘汰掉。这个环节将被自动化。Paluri 计划在明年,将需要人工介入识别的工作量下降到百分之一。 而从长期来看,Facebook 是要将视觉识别和自然语言处理平台的技术相结合,从而实现更加具有「生命力」的人工智能技术。 但是,要完成上述的目标可不是简单的事。因为社交平台上出现的一切问题都归结于人本身。要知道,这是一个拥有几十亿用户的平台,上面流窜着的很多信息就连人都很难从中分辨真伪,你又怎能指望机器帮你把这一切都彻底解决掉呢?但 Candela 对此还是有一些信心的:「我们不可能随机地将很多无关的信息推送到用户眼前,我们更不可能只从一处来源提取信息,目前在机器学习领域已经有好几个团队同时进行研发,让机器在内容发现上处在一个恰当的水平线上。 当 Facebook 发现自己深陷「虚假新闻」的舆论风暴旋涡时,它让所有人工智能团队出动,采用各种技术手段,将炮制的虚假新闻从平台上剥离出去。这可是前所未有的全员行动,就连致力于长期战略发展,具有一定顾问性质的 FAIR 团队都出动了。而 FAIR 的表现也没让任何人失望。他们开发出来了一款名叫 World2Vec 的模型,它给神经网络赋予了记忆的能力,这可以帮助 Facebook 给每一段内容都打上标签,例如它的出处是哪里?它是经由哪些人分享传递的?(这里特意说明一下,Google 科技创新产品中有一个叫 Word2Vec,不是一回事儿)。在这样的技术支持下,Facebook 可以清楚虚假新闻的模式,传递路径都有着怎样的特点,然后再将其识别、剔除出去。 「其实,识别虚假新闻的能力,跟找出人们最想看的页面的能力没有什么区别。」LeCun 总结道。 (责任编辑:本港台直播) |