本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

wzatv:【j2开奖】观点|朱松纯:初探计算机视觉三个源头兼谈人工智能(8)

时间:2016-11-30 01:47来源:本港台现场报码 作者:118KJ 点击:
朱 :他总结说,过去两千多年西方科学的发展建立在亚里士多德以来的数理逻辑基础之上。但后面一千年包括人工智能、人的思维这些东西是随机性过程

:他总结说,过去两千多年西方科学的发展建立在亚里士多德以来的数理逻辑基础之上。但后面一千年包括人工智能、人的思维这些东西是随机性过程。人的思维应该是建立在概率推理基础之上。其实我们看到现在的机器学习、人工智能完全就是从这个方向走了。

:你的导师说,整个世界的数学可以用概率的这套思想重新写一遍,就像罗素和怀特海的写这个数学原理似的,可以把数学重新建立起来,用概率的这种思想。

:这个工作已经有人做了。E. T. Jaynes就是发明最大熵原理的那个人,他写了一本很厚的书,《Probability Theory: The Logic of Science》他就是用这个原理去写。这也是一篇遗作。他没写完就过世了。这也是以后可以谈的话题。

  Ulf Grenander就诞生在这么一个概率发源的中心的地带,跟几个大师学习,博士毕业后出来游历,做概率论随机过程的这些东西。到六、七十年代的时候,他就开始提出来,想用数学来把这个模式识别与智能的现象的问题定义清楚。我们前面谈到的David Marr 是从神经科学、认知科学来的。傅京孫是一个计算机科学与工程的人。这两者基本没有多少严格的数学定义,提出的框架是漂浮的。Ulf是从数学的角度,奠定基础。他提出来一个应用数学的分支, 叫做 Pattern Theory。他的出发点完全不同, 就是要给世界上的各种模式、现象,建立一个数学的框架来研究,格局就很宏伟,而不是急于去解决某种实际问题,后者叫做模式识别 (pattern recognition)。 他在90岁高龄出版了最后一本书,想用数学来研究人的思想是从哪里来的——你看我们脑袋里的念头、主意也往往是随机产生,像冒泡一样,所谓思如泉涌,到底怎么来的?

:那太了不起了。这个事说起来,我想到当时我的老师让我读Geman and Geman 1984年的吉布斯采样算法,那就已经了不起了。

:Grenander最后落脚在布朗大学应用数学系,Geman是他当年(70年代末80年代初)招到组里的年轻教员之一。这个吉布斯采样(Gibbs Sampler)的算法是一个里程碑的东西,在80年代初引起轰动。但那只是这个学派的诸多贡献的一个片段。

Grenander的理论解释起来的确有点费劲,既然谈历史,我先从我个人的经历谈一下。

他1994年出了一部总结性的书,900多页,叫做《General Pattern Theory》,广义模式理论。有点爱因斯坦做广义相对论的意思。但这本书很抽象,没多少人读。我1995年在哈佛研究纹理模型(texture models),因为我用的学习算法就是吉布斯采样,在训练的时候跑一遍要等两个星期才收敛,机器被占了,我就有时间,也是耐着性子把这本书读完了。我估计世界上不超过20人,能有耐心完整地读他的书。然后,我1996年1月答辩论文,我导师和我每周开车去布朗大学参加讨论。波士顿的冬天很冷,哈佛到布朗1个小时左右,漫天大雪,我们有时在高速上车被陷住,下来铲雪。到了6月,我导师从哈佛提前退休,带我一起加入布朗的应用数学系。那在当时是一个学术思想的中心。组会里有Grenander、Mumford,、Geman, 还有其他20来人,一坐就是2个多小时。这些人都明察秋毫,做报告的人无法含混过关, 一步一步都必须理清楚,说不清楚你就下去想,下次再来。

我一直认为计算机视觉和模式识别领域亏欠Grenander, 因为统计建模和随机计算逐渐成为我们领域的核心理论基础,而大家并不知道,很多思想、算法都源于这个人或者他的学派。所以,2012年,我主持CVPR(国际计算机视觉和模式识别)大会,特意放到布朗大学附近召开,我和另外两个主席一说,大家立即就同意了。并特制了一个银质的大奖章,在大会上颁给他,表达我们的敬意。这里发生很多故事,我们以后再谈吧。

:那你能简短总结一下Grenander对计算机视觉、甚至人工智能的主要贡献吗。

:还是谈三点主要的吧。 首先,他提出了一个思想,叫做 analysis-by-synthesis,这是所谓产生式建模的核心理念。当你要去识别、分析一个模式,比如一个动物、人脸、 一个事件, 你首先要建立一个数理模型,这个模型通过数据来拟合,也就是当前的机器学习。那么,判断这个模型好坏,或者模型是否充分的一个依据是什么?产生式建模的方法就是对这个模型随机抽样,也就是合成(synthesis)。 我把这个过程直观叫做“计算机之梦”。计算机模型一开始初始化为空(完全随机),那它做的梦就是白噪声,或者一张白纸。通俗来说, 这个模型就是一个“白痴”。人脑有这个功能,我们把眼睛一闭,没有外界输入了,就能做梦,白日梦就是想象力的体现。一个好的模型采样产生的图片(模式),与真实观察的图片(模式),就应该是真假难辨。如果你能分辨,那说明这个模型不到位。现在很多机器学习的方法是没法去随机合成图片的。举个例子来说,我要检验你是不是真的听懂和理解中文,就看你能不能说流利的中文。如果你说话语法有错、词汇量不够,或者有口音,那就揭示你在哪方面还需要提高。

:这个要求好像比光是听懂要更严格。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容