本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

码报:【裴健当选SIGKDD主席】研究被引超7万次,他还有(2)

时间:2017-07-30 04:11来源:天下彩论坛 作者:www.wzatv.cc 点击:
资料显示,2016年的KDD大会共吸引了1115 篇投稿,其中研究专题投稿论文784篇,最终有142篇录用;应用数据科学专题投稿论文331篇,录用66篇。 SIGKDD 2016年

资料显示,2016年的KDD大会共吸引了1115 篇投稿,其中研究专题投稿论文784篇,最终有142篇录用;应用数据科学专题投稿论文331篇,录用66篇。

码报:【裴健当选SIGKDD主席】研究被引超7万次,他还有

SIGKDD 2016年1月在中国设置了分会(SIGKDD China) 目前,SIGKDD China 的执行委员会主席为香港科技大学杨强教授,副主席为南京大学的周志华教授,以及百度公司副总裁沈抖。微软研究院郑宇担任秘书长,西南交通大学的李天瑞为财务主管。

数据挖掘是屠龙之术? 很多号称AI公司的企业其实都在干数据挖掘的事情

在查阅背景资料,我们看到网上有这样一种说法:数据挖掘目前在中国的尚未流行开,犹如屠龙之技,现实情况是这样吗?裴健教授说,就他了解的情况,其实数据挖掘在中国到处开花结果。实际上很多号称AI公司的企业都在干数据挖掘和数据科学的事情。大家越来越认识到 AI 应用数据为王。

针对现在数据挖掘行业存在概念混乱的现象,许多局限在报表的展示和简单的统计分析,却也号称是数据挖掘。裴健教授认为,报表是数据挖掘结果的重要展现形式之一,另一个重要展现形式是可视化分析。数据挖掘可以从报表和简单的统计分析出发,关键是逐步挖掘业务需求和潜能,推进数据挖掘的深入应用,在业务中发挥作用,产生越来越大的价值。数据挖掘的关键是能利用越来越多的数据产生越来越大的业务价值。

关于数据挖掘,有人说“沟通能力和兴趣爱好是个人的数据挖掘的核心竞争力”,对于这一观点,裴健在接受新智元的采访时表示:“数据挖掘的核心是对数据和业务的理解能力和对算法的构建能力。沟通能力很重要,是对数据和业务的理解能力的关键,但同时算法的构建能力也很重要。”

研究被引用数量超过7万次,裴健还有一个遗憾

在谷歌学术上,我们查到,裴健教授的研究总共被引用数量超过了7万次,2012年至今的5年间,被引用次数超过3万5千次。在数据挖掘领域可谓有着强大的影响力。

码报:【裴健当选SIGKDD主席】研究被引超7万次,他还有

在采访中,我们希望裴健教授向我们推荐一篇他认为最满意的论文。谦虚的裴健老师表示,“与其选自己最满意的论文,还不如说自己最常有的遗憾。 ”

他说:“每篇论文发表之后就会留下遗憾,因为总有可以改进的地方。回头看,对自己的每篇论文我都能说出自己的遗憾。与其选自己最满意的论文,还不如说自己最常有的遗憾。 我经常遗憾对一个问题的本质认识不足,忽略了更简洁的算法,对别的领域不够了解,未能借用别的领域已有的技术和方法。”

数据挖掘其实是一个非常跨学科的领域,与众多学科相互促进,共同发展。以人工智能和机器学习为例,可以结合的点非常多。对于这种跨界的合作,裴健教授对新智元介绍说:“我和机器学习的专家合作很多,自己也可以滥竽充数地说懂一点机器学习。我在数据库、数据挖掘、机器学习和信息检索多个领域都做一点,和不同的学者合作,从他们身上学到不同的东西,如不同的思维方式和领域知识,收益非浅。多跟不同的人合作是很有帮助的。”

KDD最新趋势: 深度学习最近的发展很Disruptive

KDD领域近年来向机器学习靠拢的趋势很明显。从大会评选出的最佳论文,以及组织举办的Workshop就能够看出,话题与实际应用结合非常紧密,keynote 演讲里还有专门请投资人从VC视角讲解机器学习。

那么,atv,这算是一个大趋势吗?

裴健教授在接受新智元的专访时表示,机器学习本身就是数据挖掘的一个重要工具,20年前数据挖掘创始的时候的三大主要内容就包括机器学习。机器学习与数据密不可分,数据挖掘是打通从数据到业务的端到端流程。

再具体到深度学习,裴健说:“深度学习最近的发展很 Disruptive。在数据挖掘领域,很多工作用深度学习作为工具。KDD上有很多文章提出了很有趣的问题,然后用深度学习作为工具巧妙地解决了问题。建议感兴趣的读者去浏览一下今年来的KDD论文集。”

聊一聊数据:这样才能获得高效的、优质的“燃料”,确保火箭不会出事?

人工智能的发展很大程度上依赖于数据的获取,有人曾说,如果人工智能是火箭,数据就是燃料,从你在数据挖掘多年的经历来看,怎样才能获得高效的、优质的“燃料”,确保火箭不会出事?现在深度学习领域出现了各种各样的数据集,数据的量非常大,在图像领域就出现了比著名的Imagenet要大很多的数据库,那么,开奖,是不是数据永远是越大越好?对于研究者来说,怎样才算是适合的数据?

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容