本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

【组图】大会|CIKM 2016:大数据科学的前沿与应用(3)

时间:2016-11-22 20:16来源:天下彩论坛 作者:开奖直播现场 点击:
我们团队的论文“ Learning to Extract Conditional Knowledge for Question Answering using Dialogue ”则是一篇关于知识库搭建的文章。在现实生活中,很多人机对话往往由于

我们团队的论文“Learning to Extract Conditional Knowledge for Question Answering using Dialogue”则是一篇关于知识库搭建的文章。在现实生活中,很多人机对话往往由于条件不足而引起,比如在预订车票的对话中,常常由于用户在发起订票命令时缺少“时间”,“地点”,“人名”等条件,导致智能助手会主动提问,从而产生了长对话。类似的应用场景还有预定会议室、购买手机等场合。然而在目前的对话系统中,这些所谓的条件往往都是人工提前设定好的,只要系统检测到用户没有提供这个条件就会主动发问。然后每个场景的条件往往很不相同,这就需要大量的人力来手动提取条件。基于此,我们提出从问答语料库中自动抽取条件性知识库用以支撑人机对话。传统的知识库或知识图谱以三元组形式保存,即(主语,谓词,宾语)。本文提出的条件性知识库的形式为(主语,谓词,宾语|条件),其意义在于在给定主语和谓词不变前提下,宾语会根据条件的不同而不同。在抽取得到的条件性知识库后,用户输入一个问题,我们的系统首先会检测用户问题是否缺少条件,如果缺少就反问用户并让用户补全条件,最后系统返回正确的答案。

  CIKM 25周年庆典

CIKM大会从1992年开始至今已经走过了25年,今年的大会特别回忆了起步之初的情景:第一届会议在Radisson Lord Baltimore酒店举行(如今已破产),当时大家对于互联网还是特别新鲜。Tamer Ozsu和Ed Fox关于DBMS和IR讲了一整天的专题报告,而Bruce Croft则给出了CIKM史上第一个邀请报告。当年参与过第一届会议的学者如果亲临现场肯定会有往事历历在目之感,而现场也邀请了前几届大会主席依次上台回顾CIKM这25年的历程。

谢乐星教授给出了CIKM从1992起到2015年这24年里论文的引用统计图表(更多内容参见)。从下面两图均可看到,就引用和被引用的比例而言,CIKM和COLING、WSDM、ICDM、EMNLP、ACL、WWW、AAAI、SIGIR、KDD等国际顶尖会议的互相引用比例相近。从CIKM引用其他会议或期刊比例来看,SIGIR、WWW、KDD、VLDB以及SIGMOD居于前五位。从CIKM被其他会议或期刊引用比例来看,SIGIR、WWW、KDD、ECIR、TKDE居于前五位。谢教授根据CIKM近24年的引用统计图表,给出了一个有意思的结论:科学想法来自何方,又去到何方?

  

【j2开奖】大会|CIKM 2016:大数据科学的前沿与应用

  

【j2开奖】大会|CIKM 2016:大数据科学的前沿与应用

同时谢教授又给出了一个关于“在CIKM发表的文章,最多能持续多长时间被引用”的统计,结果基本成线性递减。基于此,谢教授也给出了一个很有意思的话题:经过5年、10年、20年,哪些论文是最容易忘记的,哪些论文会一直被研究者牢记?

  

【j2开奖】大会|CIKM 2016:大数据科学的前沿与应用

  立足今日,展望未来

本次CIKM在展示相关领域最新研究动态的同时,也对信息检索以及知识挖掘的下一步发展有启示意义。

深度学习在信息检索中进一步应用。此前深度学习在图像和语音领域中取得了巨大的成功,但是在信息检索中效果不尽如人意。究其原因主要在于图像语音和文本有很大的本质区别,将适用于图像和语音的深度模型直接移植用于文本往往效果不会好,应根据文本自身性质来改变网络结构。

半监督学习的应用由于近年来数据量急剧增大,人工标注已然不现实,既浪费人力、财力,又浪费时间。近年来很多研究员着手研究利用半监督算法或者类半监督算法来充分利用没有标记过的数据或者其他任务中标记过的数据,比如多视图学习(multi-view learning)、主动学习(active learning)、多任务学习(multi-task learning)、迁移学习(transfer learning)以及终身学习(lifelong learning)等算法。

个性化服务的搭建随着人类需求多样性的增加,用户对传统的智能服务要求也是越来越复杂,对用户最为贴心的当属个性化服务,比如个性化搜索以及个性化智能助手等服务。然而个人文件和外部数据比起来,数据量非常之少,因此,如何将个人文件等小数据融合到外部的大数据,并且个人文件小数据也会影响最终的结果,是一个非常有挑战的任务。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容