新智元启动新一轮大招聘:COO、执行总编、主编、高级编译、主笔、运营总监、客户经理、咨询总监、行政助理等 9 大岗位全面开放。 简历投递:j[email protected] HR 微信:13552313024 新智元为COO和执行总编提供最高超百万的年薪激励;为骨干员工提供最完整的培训体系、高于业界平均水平的工资和奖金。 加盟新智元,与人工智能业界领袖携手改变世界。 【新智元导读】本文是 Google Play 的 “App 发现”系列文章的第二篇,谷歌 App发现团队讨论了如何使用深度学习,根据用户曾经下载过的 App 和用户的使用环境,为用户提供个性化的app推荐。 在“App 发现”系列的第一部分,我们讨论了如何使用机器学习更深入地理解与 App 相关的主题,以在 Google Play 商店上提供更好的 App 搜索和发现体验。在本文中,我们将讨论深度学习框架如何根据用户曾经下载过的 App 和用户的使用环境,为用户提供个性化的App 推荐。 我们的 App 发现团队的主要目标是为 Google Play 商店的访问者提供有用而且相关的app推荐。然而,对与 app 相关的主题的理解能力仅仅是创建一个为用户服务的良好系统的一部分。为了得到更好的整体体验,还必需考虑用户的兴趣,并提供个性化的推荐。如果没有这样的功能,那个“您可能还会喜欢”的推荐栏会变成所有人都一样。 发现这些细微差别需要系统能同时理解 App 的功能,并且考虑用户的情况。例如,对于狂热的科幻游戏迷,推荐类似的游戏可能是用户感兴趣的;但对安装了一个健身 App 的用户,推荐一个健康食谱 App 比继续推荐5个健身 App 更好。由于用户可能更想下载已经安装的应用或游戏的补充内容,我们会根据应用的相关性提供推荐内容(“您可能还会喜欢”),此外还会根据相关的主题提供推荐的 App(“同类应用”)。
在下载应用之前(左)及下载过程中(右)都会显示“您可能还会喜欢”和“同类应用”的推荐。 一个特别明显的语境信号是 App 相关性,该相关性基于用户的安装历史和搜索查询的点击记录。例如,一个搜索并且下载过许多图形密集型游戏的用户,可能相比简单图形的 app,会对同类图形密集型游戏app更感兴趣。所以,当这个用户安装了一款赛车游戏,“您可能还会喜欢”栏的推荐应该包括与“种子”app 相关的游戏(因为他们都是图形密集型的赛车游戏),atv直播,并且排在其他简单图形的赛车 app 前面。这样,推荐内容能够更加个性化,推荐 App 的特征能与用户的偏好匹配。 为了在我们的 App 推荐系统中结合上这种 app 相关性,我们采取了两方面的措施:(a)离线候选生成(offline candidate generation),即在主题 App 之外,生成其他用户下载过的潜在相关 App;以及(b)在线个性化重新排序,即使用我们的个性化机器学习模型对这些候选 App 进行重新排序。 离线候选生成 找到相关 app 的问题可以归类为“最临近搜索”(nearest neighbor search)问题。给定一个应用 X,我们想找 k 个与其最邻近的 App。在“您可能也喜欢”的情况下,可以用基于计数的朴素方法,即假如很多人同时安装过应用 X 和应用 Y,那么应用 Y 可以作为种子应用 X 的候选。但是,由于这种方法难以在大型的问题空间中有效学习并推广,在这个问题下难以应用这种方法。因为 Google Play 商店有超过 100 万个 App,其可能的 App 配对总数超过 10^12。 为了解决这个问题,我们训练了一个深度神经网络来根据用户安装的前一个 App,预测其下一个可能安装的 app。在这个深度神经网络最后一层的输出嵌入通常代表给定用户已经安装的 App 类型。我们接着使用最近邻算法在训练的嵌入空间中找出给定一个种子 App 的相关 App。这样,我们通过使用嵌入来代表 app,修剪了潜在候选的空间来实现降维。 在线个性化重新排序 在前一个步骤中产生的候选代表多个维度的相关性。我们的目标是给这些候选评分,让它们能够以个性化的方式重新排序,以提供一种符合用户的整体兴趣,并且保持与用户安装过的 app 的相关性的推荐体验。为了实现这点,我们把候选 app 的特征作为一个独立的深度神经网络的输入,然后使用用户的特定环境特征(区域、语言、应用商店的搜索词,等等)实时地训练该网络,以预测一个相关 app 与特定用户相关的似然性。
个性化相关app推荐模型的架构 (责任编辑:本港台直播) |