本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

码报:【裴健当选SIGKDD主席】研究被引超7万次,他还有(3)

时间:2017-07-30 04:11来源:天下彩论坛 作者:www.wzatv.cc 点击:
在“数据”上有着多年研究经验的裴健对新智元介绍说:“一般来说,数据是越多越好。深度学习需要大量的数据来产生可以generalize的模型。在实际应用

在“数据”上有着多年研究经验的裴健对新智元介绍说:“一般来说,数据是越多越好。深度学习需要大量的数据来产生可以generalize的模型。在实际应用中,数据往往是有成本的。有很多应用场景不容易获取大量的高质量数据。所以说我们需要针对具体问题,获取合适的数据。在这方面,统计学对数据的采集评价有一系列的方法和原则,值得深入学习。另一个方面,要很好利用大量的数据,通常需要比较复杂的模型,对计算的要求也相应地比较高,所以我们要根据数据量和应用来选择合适的模型。”

提到大数据和好数据,人工智能发展的另一个前沿方向就是能减少数据依赖,实现无监督学习。裴健认为,无监督学习的一个难点在于其没有绝对的评价标准。例如病人可以按病因、症状、并发症、风险等很多方面进行分群。因此,无监督学习的一个难点就是如何形成合适的类别,特别是结合问题的上下文,如常识,去形成合理有意义的类别。

采访的最后,新智元提到,最近“程序员自动化”的讨论比较多,那么在数据发现和挖掘领域,是不是也可以实现“自动化”,由机器来完成数据的挖掘工作?裴健表示,数据挖掘就是致力于数据的挖掘工作自动化。这是我们数据挖掘领域专家正在努力做的。返回搜狐,查看更多

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容