除了专题报告,CIKM-2016还举办了多场特邀报告,其中包括3个学术性特邀报告以及4个工业性特邀报告,主讲人来自五湖四海,既有来自于高校的著名教授,也有来自于企业界的主要负责人。比起主题讲座,特邀报告内容则更加全面细致,开奖,基本可以涵盖这一领域的历史发展,同时也给出该领域的展望以及预测。下图为3个学术性特邀报告的主讲人。
Rakesh Agrawal教授的报告题为“Toward Data-Driven Education”,提出并给出如何将日常学习教育抽象成一个知识图谱,其中每一个节点均是一个学习单元,再根据这样一个构建好的知识图谱,使用数据挖掘技术来提高整体的学习目标。这就给出了一个很好的将学术(知识图谱以及数据挖掘)与产业(学习教育)相结合的例子,非常有创意,感兴趣的读者可以复制以下链接以下载Rakesh Agrawal教授本次讲义(https://aminer.org/archive/5807c78232917761ff2bf3ae)。 Susan Dumais教授的报告题为“Personalized Search: Potential and Pitfalls”:传统的搜索引擎对不同用户提出的同一问题返回的搜索结果是相同的,然而有时不同的人对同一个提问会有不同的意图,这造就了个性化搜索的诞生,Susan Dumais提出了一个统一的框架,将个人信息融合到搜索引擎中,最终达到个性化搜索的要求。读者可在此下载讲义(https://cn.aminer.org/archive/573697446e3b12023e631cd5)。 Andrei Broder教授的报告题为“A Personal Perspective and Retrospective on Web Search Technology” ,通过回顾自己近20年中关于互联网搜索以及预测的工作,指出了在这20年的成果中,哪些取得让人满意的结果,而哪些方法又会产生不好的结果。 奇思妙想,别出心裁 本次大会的最佳论文奖颁给了“ Vandalism Detection in Wikidata” (doi>10.1145/2983323.2983740),最佳学生论文奖颁给了“Medical Question Answering for Clinical Decision Support” (doi>10.1145/2983323.2983819)和“Constructing Reliable Gradient Exploration for Online Learning to Rank” (doi>10.1145/2983323.2983774)两篇论文,最佳展示奖颁给了“ Inferring Traffic Incident Start Time with Loop Sensor Data” (doi>10.1145/2983323.2983339). 以下简单介绍一下这几篇优秀论文(更多优秀会议论文分析,敬请期待)。 “Medical Question Answering for Clinical Decision Support”:这篇论文属于自动问答系统研究范畴,首先从大量电子医疗文档(EMRs)建立好一个非常大的概率性医疗知识图谱,然后根据知识图谱以及给定的医疗案例topic(包含该医疗案例的描述性片段、医疗案例总结以及该医疗案例问题),提出三种答案生成的方法,最后用已生成的答案将相关的科学文献排序。 “Constructing Reliable Gradient Exploration for Online Learning to Rank”:这篇论文提出两种方法来改进现有的在信息检索系统中使用的在线学习排序(OLR)算法。第一种为DP-DBGD, 该方法是从DBGD方法扩展而来,通过使用两组随机相反的梯度探测方向取代随机单方向梯度探测来减少梯度逼近的差异。第二种为MP-DGD,不同于之前使用随机向量构建无偏梯度估计的OLR算法,该方法通过一系列标准单位基向量来构建一个确定性的梯度估计。该论文最后还提出一种利用历史探索得到的先验知识使多个检索结果融合为一个交叉结果的算法CI。 “Vandalism Detection in Wikidata”:这篇论文提出了一种新的机器学习方法来自动检测Wikidata中的恶意修改。该文从内容信息和上下文信息角度提出了47个特征。基于内容信息的特征集合主要包含字符级特征集合、词级特征集合、句子级特征集合以及陈述级特征集合。基于上下文信息的特征集合主要包含用户级特征集合、条目级特征集合以及修正级特征集合。根据上述特征集合,使用随机森林作为分类器进行分类。 (责任编辑:本港台直播) |