再者,深度学习现在做成熟的主要是监督学习,用大数据集做算法的训练来优化参数,有现成的数学方法来建立相应的模型,如卷积函数对应卷积神经网络,进一步发展的无监督学习更有用,但所需优化的非线性函数在数学上同样是问题,如果数学上没有找到所需的函数形式,这需要有所突破,这种突破从数学上也是很重大的,现在无监督深度学习只能应用一般的强化学习方法,如AlphaGo所做的应该就是这样子。 最后,深度学习不等于机器学习,机器学习只是AI的一个方面,深度学习之外的AI技术没有一项是深度学习能做的,如推理这种反映人类高级智能的能力,深度学习做不了最基本的数学中的演绎推理。 如何评价深度学习以外的研究方向? 林作铨: 由于深度学习的火热似乎AI的其它研究方向显得不重要了,其实不然。AI是属于计算机科学的一个分支,旨在用计算机模拟人的智能,希望找出人的智能原理,并把计算机做得具有智能,让人使用更方便。 以深度学习为代表的AI研究某种意义上已偏离了AI的方向,一来,深度神经网络本来想借鉴神经科学中对大脑神经网络的了解来建立模拟网络,但花样百出的人工神经网络已跟大脑神经网络不相干;二来,通过人工神经网络模拟智能,想促进对大脑神经网络原理的认识,也无从谈起了。学习是人类智能的基本特点之一,学习很复杂,基本上有两种形式,一种是象婴儿学习,没有先验知识,从观察示例开始,这方面可以说深度学习模拟得最好;另一种,人成长过程,更多的是基于知识的学习,有其它机器学习方法就是研究知识中的学习,这是深度学习做不了的,因为深度学习不能运用知识。 深度学习之外的AI研究方向很多,举个例子,知识图谱是深度学习外的另一个时下热门。谷歌收购了Freebase后提出知识图谱名称,并不是新东西,微软称为概念图谱,都是要建造本体库,也就是一种知识库,可应用到各种知识系统,例如,在Web搜索中可通过知识图谱理解一些网页的知识,建立一些知识卡片,使得搜索引擎更加智能化。这是下一代Web的目标,W3C组织早在近20年前就提出语义Web作为下一代Web,并提出现在知识图谱常用的RDF等本体表示语言和标准。再往前看,语义Web和知识图谱想解决的语义网络早再30年前AI就研究清楚了,甚至再过几年知识图谱仍达不到当时AI理论上已搞清楚的能力。学术研究总是超前的,知识图谱可看成AI这方面研究开始落地生根了。知识图谱应用范围和影响力将不比深度学习差,也能改进机器学习方法。 AI还有一个当下的热点,就是会话式AI系统。自从苹果iPhone Siri以来,到现在以亚马逊Echo/Alex音箱为代表的所谓智能音箱,会话式AI具有广泛的应用场景,很多企业都涌入这个领域。会话式AI其实很难的,属于自然语言理解领域,几十年来对自然语言理解研究进展不大,因此AI主要进行各种语音和文本语言处理,前段时间主要采用概率统计的方法,现在深度学习不仅在语音识别上获得成功,也开始用到文本信息处理,如机器翻译,用深度学习比用统计学习效果要好。 关于自然语言理解,有理论派和经验派之争。理论派以乔姆斯基提出的文法理论为代表,机器学习就是经验派的代表,50年前就发现用机器学习根本学不出一些基本的语法,更别说更复杂的语义和语用,因此理论派甚至认为,人一出生大脑就对语言有某种天然的结构能理解语言,后天才能很自然地学习并运用自然语言,AI学者坚持认为通过软件可以逐步理解自然语言。40年前,蒙塔格(Richard Montague)企图形式化英语,若自然语言(如英语)能被形式化,就可转化为形式语言,可作为类似程序语言来使用,虽然蒙塔格达不到目的,由此以来,在自然语言理解方面积累了很多深奥的理论,这些理论远比现有的各种自然语言处理系统理解得深远,但还未能被应用。 自然语言理解几乎包含了AI研究各方面的内容,可以说,如果自然语言理解问题解决了,AI问题也就解决了,用自然语言进行达到人类程度的人机交互是个梦想,还很遥远。 回过头来说深度学习,现在监督深度学习技术已经比较成熟,有很多开源的开发平台,甚至设计专用芯片从硬件上直接提高计算性能。AI发展中一些相对成熟的技术,未能带来对AI的进一步发展,就会归入计算机科学其它分支,现在做深度学习大多是技术的应用,做出来的水平也差不多,已有这种趋向。 人工智能的学术研究未来比较有可能在哪个方向有突破? 林作铨: (责任编辑:本港台直播) |