本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

码报:英特尔研究院院长宋继强:gcForest用什么训练?(2)

时间:2017-06-16 00:01来源:香港现场开奖 作者:本港台直播 点击:
如果把它换成其他一些中间学习的部件,比如像gcForest这种基于决策树做的一系列工作,最大的好处就是,从特征过来的时候,会在每一个分支下做判断。

如果把它换成其他一些中间学习的部件,比如像gcForest这种基于决策树做的一系列工作,最大的好处就是,从特征过来的时候,会在每一个分支下做判断。比如这个特征要大于某一个值的时候向左分支,小于某一个值的时候向右分支,所以天然就有一些规则在那儿。它的参数空间就会小很多,训练出来以后可以去分析和解释。这也是为什么目前在著名的Kaggle数据科学比赛平台上,多数获胜者的模型还是基于决策树扩展和集成(比如XGBoost)做出来的。

如果这件事情能从理论上解释得通,我们对这个模型就有充分的信心了。机器学习真正出来一个结果后,我可以把它变成知识,而不只是停留在模型的层面。因为从让机器去学,到最后变成人可以认可的理论和知识,这是一个完整的过程。

适用领域

其实周老师在他论文的开始也提到了一个问题,在深度学习的领域,大家比较认可的是,做表示学习的时候,模型如果深、层级多,就可以更好的去表示这样的问题。为了达到这样的结果,就需要模型的容量够大,但是不是一定要采用神经网络去训练?这个是可以商榷的。

我认为不是所有的情况下神经网络都是最优的训练学习模型,因为有时候用它反而把事情复杂化了。

英特尔对AI领域的分类

另一方面,深度神经网络虽然非常适合语音和图像的识别,但AI领域其实不只包含这些,还包括理解,推理并做相应的决策。整个过程都构造好了,那才是让人工智能完全可以完成任务。

现在深度神经网络帮助我们解读了视觉信息,因为视觉信息是一帧一帧的图象,还有很好的空间关系。我们本身看见的东西都是像素点构成的,中间是有空间的关系。而用卷积这种方式提取特征,是很适合去提取空间关系的,并且构造了多个维度、不同方向上的,atv,多个分辨率的提取特征的方式,最后放到巨大的多层网络里去找它相应的关联。

到下面一个层级,开奖,时间轴发生变化。比如这里是一个人,那里是一张桌子,那边是一把椅子,随着时间的推移,人在动,桌子上可能多了一个东西,所以要继续理解这个场景的时候,未必能完全依靠现在的神经网络的方式去提取特征,这时候就需要依靠别的。

gcForest论文里面用的几个测试集就很有意思,几个测试集在图象层级上的处理,其实跟深度神经网络差不多,稍微能打平,甚至是数据集大的时候,深度神经网络还是会比它好。

但是在涉及到时间维度上,有连续性的东西,或者是要把情感从杂乱无章的文本里抽取出来的时候,这种空间关系不是那么好的数据,发现它的提升还是蛮大的。比如说一个简单的识别,这里面有一个叫hand moment recognition,通过机电信号去识别手势,比别的方法提高了大概接近百分之百。这是非常有说服力的,也就说明它在处理这些连续有规则信号方面(因为这个手势是具有一定规则的),非常的简洁高效。

总之,在进一步去探索AI的技术的方向上,第一,基于决策树的模型更具有可解释性;第二,深度森林可以帮我们去理解很多在时序上和空间上都有规则的事情。

所以我觉得这是一个新的思路。从英特尔层面来讲,是欢迎有这种新的思路存在,因为这样的话才能真正体现出多样性。

2

关于AI芯片的架构之争及软件生态

能从解读产品的角度来谈谈为什么在运行gcForest方面,KNL相比GPU会有优势吗?KNL和GPU甚至是TPU的区别和联系表现在哪里?对于AI芯片的架构争论,您怎么看?

宋继强:实际上我们应该把这个问题放在不同的应用领域来看。在AI芯片这个领域,凡是有人说有一个通用的方案的,其实都是不对的,英特尔从来不会说我们有一个东西能包打天下。

所以英特尔在端层面,有Movidius;在Edge层面我们用像FPGA这样的方案;在云端我们有KNL、Lake Crest这些。

对于不同的应用,我们要给用户最适合的解决方案,这种方案里同时考虑数据的加速,带宽的处理,甚至考虑到通讯怎么处理,在前端要考虑功耗怎么样等等。

具体的拿gcForest来说,它的特点是里面有很多不同的树,每棵树本身的训练是可以分开做的,所以本身就有很大的模型的并行度。KNL和GPU都可以用,但是KNL的好处是它本身就有72个核,每个核上还可以出4个Hyper tread,等于本身就可以提供288个线程,是理想的模型级并行的加速器。

KNL的硬件架构图

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容