所谓一千个读者就有一千个哈姆雷特,我也只是站在自己的专业角度去领悟WWW’17的会议精神。万维网发展到今天已经形成了相当庞大的格局,海量的数据既让人兴奋又带来迷惑。 个性化服务依旧是当今的一个研究热点。来自加利福尼亚大学和微软合作的文章[1] 系统性地分析了消费者的习惯和价格敏感性,进而提出了一种基于内嵌特征的矩阵分解推荐模型。他们认为,三步骤的推荐系统设计,即:类别需求预测——子类商品推荐——购买数量预测,可以在有效抓住用户偏好的同时大规模地部署到线上服务。根据他们的分析结果,价格因素对粗粒度的商品类别之间影响很有限,但是同类别内的商品选择影响很显著。 无独有偶,国立成功大学的学者们也留意到价格的重要因素[2]。他们认为,不同消费者的心理价位是不同的。通过设计一种“实时折扣促销”系统,他们可以针对不同的消费者,根据分析出的心理价位来调整促销方案,从而刺激消费,最大化商家收益。
图:分成三阶段的消费者决策模型。来自参考文献[1] 深度学习方法也在持续绽放它的光彩。除了在用户建模上应用深度学习之外,来自德克萨斯州大学与谷歌合作的文章[3]基于LSTM构建了用户潜在意图推测模型,又如来自浙江大学的文章[4]把多样本学习和神经张量网络相结合,构建用户满意度推测模型。 特别的,深度学习在推荐系统的应用上也更上了一层楼。韩国浦项工科大学的学者[5]发现,对于推荐系统,从商品的图像等内容中学出的特征有时候并没有显著帮助。原因是虽然对于部分种类的商品,例如衣服,图像是很有用的信息,但是对于例如办公用品等商品,颜色、款式等可视化特征并没有那么重要,用户考虑的更多是它们的功能特点。因此他们把用户曾经浏览过的商品也作为一种信息源。文中指出,最终购买的商品和之前浏览的商品在功能上会有相似,通过学习它们之间的潜在联系,可以弥补图片特征的不足之处。 新加坡国立大学的学者们[6]认为,现有的新型推荐系统主要还是把深度学习应用在提取内容特征上,但缺乏在协同过滤算法上的应用,因此他们用神经网络来描述传统的协同过滤算法。实验结果表明,通过引入复杂网络结构,增加非线性学习能力,推荐系统的准确度有了显著提升。 网络迅猛发展的同时自然离不开人工智能的身影,雅虎副总Yoelle Maarek在大会第一天做了题为“网络邮件没有被淘汰!”的特邀报告。她指出,表面上看,人们主动写邮件的数量减少了,使用邮箱的用户,尤其是青少年人群的比例越来越少。但实际上邮件服务并不会消亡,与以前不同的是,它不再是只有“人类”用户了。如今90%的网络流量都由机器自动产生,人类用户比较懒,不会精心花时间阅读或整理邮箱。所以现阶段迫切需要的是赋予邮箱客户端更智能的功能以顺应当前趋势,比如简化用户操作,解析邮件的主题,智能归类等。 一个发生在我身边的例子是Outlook的事件管理功能。当我在网上购买了去珀斯的往返机票后,代理商往我的邮箱发送了机票订单信息,Outlook便自动往我的日历中加入出行计划这一事件,方便我随时查阅、安排行程。 也有学者们关心人工智能技术发展的同时带来的不良因素。文章[7]中指出,随着社交媒体的发展,出现了一种新型的 “social spambot”机器人账号。它们避开了传统的反垃圾账号算法的设计原理,拥有与正常人类账号类似的个人介绍与活动状态,以至人工肉眼都很难区分它们与人类账号。这些机器人账号会被人利用,做一些不正当的活动。例如2014年罗马市长大选中,某位排名靠前的候选人用了约1000个机器人账号来伪装自己的人气。文章[7]中公开了许多高质量的数据集,指出现有的反垃圾账号算法效果有限,并呼吁大家重视新算法研究的问题。 (责任编辑:本港台直播) |