由InfoQ中国团队推出,面向高端技术管理者和架构师的全球架构师峰会(ArchSummit)日前在北京国际会议中心举行。来自腾讯、滴滴出行、一点资讯等互联网企业的技术专家受邀出席并做主题演讲。 在本次大会上,一点资讯高级技术总监田明军详细诠释了深度融合搜索和推荐引擎对获取用户阅读兴趣、实现信息精准分发的必要性,并以一点资讯为例,从技术框架和产品理念角度,分享了兴趣引擎将二者有机融合的心得。 他认为,搜索和推荐两种获取信息的途径和体验缺一不可。一点资讯的兴趣引擎系统通过结合了用户搜索行为所触及的全网数据,不断学习用户的兴趣再进行推荐,并由用户主动“订阅”深化这一兴趣,建立兴趣之间的连接点,从而打通用户对信息的主动表达和被动接受两条通道,使信息获取更加高效、精准,为全方位提升用户体验打下了坚实的基础。 以下为田明军演讲内容精编版: 大家早上好,非常荣幸今天有机会与大家分享一点资讯关于融合搜索和推荐引擎的一些思考和实践。 单一的搜索或推荐引擎不利于全面满足信息分发需求 在移动互联网时代,搜索和个性化推荐都是用户获取信息的两种重要的方式:搜索通常伴随着用户的明确表达,用户输入关键词即可找到自己想要的答案;反观推荐,则是用户通过产品呈现的内容进行非目标性的兴趣浏览。但这两种体验是不能互替的,单纯根据历史浏览记录进行的个性化推荐并不能了解用户某时刻的自身想法,而另一方面,也很难根据每天一两次搜索行为总结出用户的长期规律。 所以从产品角度来说,搜索和推荐的体验二者不可或缺、关系紧密。这也是我们致力于实现二者融合的原因。 但需要注意的是,二者在意图表达方式、训练模型等方面存在着巨大差异,基于这些差异点,我们不能简单的用其中一种系统来实现搜索和推荐融合的目的。 搜索和推荐的融合之路应该怎样走? 对于融合的解决之道,一点资讯选择在搜索和推荐引擎之间加入了一个基于用户兴趣的任意关键词订阅环节。通过搜索发现用户所查询的答案同时,我们也提炼、扩充出针对用户兴趣的表达,并以此固定沉淀在用户画像里。因此,搜索让个性化推荐层面,增加了一条高效地获取用户兴趣的途径。 反过来说,通过推荐系统把共性的有趣、有料的内容呈现给用户,直播,通过推荐产品收集到用户更多层面的反馈,从而得到这些内容的普适性特征。基于这些特征的挖掘,我们也能够对内容有更深刻的了解。而再将搜索体验中加入并有效利用这些共性特征,也更加强化、提升了搜索的品质。 接下来,我将从兴趣引擎的整体系统架构中,选取了几项关键技术点,阐述一点资讯将搜索和推荐内容体验真正融合的方法: 异构索引引领检索效率提升针对搜索+推荐深度优化 为实现深度融合的目的,针对搜索和推荐不同的服务特点和系统性能要求,首先我们提出了异构索引结构。 从上图可以清楚地看出异构索引的数据来源和组织形式。我们可以从图的底部可以看到,产生异性索引数据的平台一分为三:数据平台、编辑运维平台和内容平台。图片顶部则展示了不同数据的索引构建所采用的不同技术。 内容平台方面,对外网抓取的内容和自媒体平台生产的内容,我们建立了通用的倒排索引。 在左侧的数据平台,则通过对用户行为的挖掘,产生基于协同过滤信息的挖掘的推荐列表,以及针对不同人群放置的热文列表,这部分我们使用通用的KV数据库存储。 中间这部分的数据来源于内容平台和编辑运维平台,体现了技术与人工的结合。这部分数据存在内容的竞争机制,变化比较灵活,使用了自建的支持排序列表的索引结构。 大家也许会问,为什么会有这样的区分?这主要是基于优化检索性能角度的思考。根据关键词对倒排索引进行查询的方式非常成熟,完全够能够满足搜索系统的需求,然而,传统的倒排索引却很难对推荐需求的几十维以上的特征进行查询。 (责任编辑:本港台直播) |