Freestocks / flickr 月活跃用户达 1 亿的 Pinterest 越来越依赖机器学习,以帮助发现新的互联网洞见。 世界各地的用户访问 Pinterest 是为了探索、保存和分享照片及文章。帮助用户找到自己喜欢的内容,用户自然会被留住:Pinterest 上 30% 的互动和 25% 的 Pinterest 内购来自于 Pinterest 推荐的相关内容。为了推荐合适的内容,Pinterest 使用了由数据驱动的顶尖技术,还进行了大量试验。 那么,Pinterest 是如何利用机器学习实现的呢? Pinterest 首席发现科学工程师(lead discovery science engineer) Mohammad Shahangian 表示:“我的主要工作是找到解决内容发现问题的方向。我们会对算法做非常小的改变进行试验,每一次尝试都有其改进或不好的地方。” 独家优势:基于兴趣
thestreet 实际上,这和 Pinterset 的特点不无关系:它的优势之一在于,atv,Pinterset 是围绕用户的兴趣而建立的社区,用户会将自己从互联网上找到的产品、文章和图片按兴趣分类。 这意味着 Pinterest 不用像其他社交网站一样,通过点击模式或在某个页面上花费的时间来猜测用户的兴趣,而是可以直接用算法来衡量其数据库中 750 亿个条目之间的关系,因为这些条目很可能被归在同一个兴趣之下。 Mohammad Shahangian 说道:“许多公司试图通过输入或信号来推导用户兴趣。但在 Pinterest,j2直播,用户明确地给出了自己对什么感兴趣的信号。” 访问 Pinterest 的用户们在不断为这个由用户、搜集到的条目以及收藏板所组成的社交图景添砖加瓦。这些数据又可以让 Pinterest 更精确地为用户主页消息流、搜索结果以及相关内容推荐提供内容。单纯根据用户关注的内容向用户推荐并不理想,而推荐相似内容又很容易重复。 在 Mohammad Shahangian 看来,“如果你收集了一个厨房水槽的条目,我们应该给你推荐更多水槽呢,还是推荐可以让你的厨房焕然一新的条目?” 在实践中不断测试 为了作出这些决策,Pinterest 的工程师们试验了多种机器学习算法。他们研究了这些算法在相关和不相关条目上的效果,以及它们如何影响真实用户的活跃度。 Mohammad Shahangian 说道:“我们确实会直接在 Pinterest 上做试验,但很多时候我们都会先做很多准备工作再试验。” 当然,如果不进行实际测试,就根本没办法知道某个用户是否会喜欢新的推荐内容。“我没法花钱请人告诉我,某个用户是否会喜欢新的推荐内容,”Mohammad Shahangian 表示。但通过研究算法推荐的内容是否会被真实用户归为某个兴趣下,这就能得到相对靠谱的答案了。 此前,Pinterest 将用户主页的消息流从纯粹的按时间排列关注用户的消息,改成了由算法生成的消息流,这一举措让用户的活跃度提高了五分之一到十分之一,后续算法改进还会带来额外提升。 Shahangian 表示:“在整个改进过程中,Pinterest 得到了长足发展。个性化极大地提高了用户活跃度。” 改进图像搜索功能 Pinterest 还一直在改进图像搜索,以帮助用户更好地找到相似图片。Pinterest 的工程师们与加州大学伯克利分校视觉与研究中心的研究人员们合作开发了这一技术。现在它已经能通过深度学习算法来自动识别图片中的物体了。这样,用户就可以点击这些物体来找到 Pinterest 中的相关条目。 Pinterest 视觉搜索工程师 Dmitry Kislyuk 说道:“这不是区分猫狗的分类算法。我们是想实时找到图片间的相似性。” 他表示,这一视觉搜索工具在发现 Pinterest 中的家庭装饰品和时尚用品上效果很好。未来 Pinterest 希望能改进其自动分类功能,以更好地满足其他搜索需求,比如帮助用户找到相似的新食谱。 在谈到用深度学习来更有效地进行图片分类时,Pinterest 视觉搜索工程师 Andrew Zhai 说道:“我觉得我们的模型会变得更语义化,也会变得更好。” Pinterest 的工程师们在专注于完善物体识别和搜索的同时,还打算开发一款应用,让智能手机用户可以拍摄现实世界的物体,然后获得 Pinterest 上的相关条目推荐。 Dmitry Kislyuk 表示道:“现如今的深度学习、计算机视觉领域令人激动人心。世界变化太快,顶尖技术每两个月就会变一次。” via fastcompany (责任编辑:本港台直播) |