目前大家经常听到的谷歌大脑、百度大脑,核心技术就是用了深度学习,主要指应用了多隐含层的神经网络。在解释深度学习之前,我们来了解一下什么是机器学习,以及其和深度学习的关系。 如上图所示,机器学习ML是人工智能AI的一个分支,深度学习DL又是机器学习ML的一个分支。 机器学习ML就是通过算法,使得机器从大量历史数据中学习规律,提取特征值,atv,例如语音识别里的MFCC特征、机器视觉里的SIFT特征等,再把这些特征放到各种机器学习模型中,从而对新的样本做智能识别或对未来做预测。 问题来了,因为在经典机器学习里,这些特征提取算法都是人们根据具体场景数据的特征人工设计出来的,所以这种方法主要靠人工经验来抽取样本的特征。 然而,深度学习DL的关键就是要从海量训练数据中自动提取特征,这也是Geoffrey Hinton和Yann LeCun这些大牛们的主要贡献。 深度学习DL在教会计算机听(语音识别)、看(图像识别)、说(自然语言处理)上,都取得了很大的成绩,尤其是前两者分别比传统的MFCC和SIFT等识别率提高了20%到30%以上,这个进步是革命性的。 简单白话一下深度学习的工作原理,一个神经元就是一个分类器,神经元模型就是不停的分类,最终不同特征就抱团了,神经网络神奇的地方就是每一个组件非常简单,但是一层一层级连(多隐含层)后,高质量的特征值就奇妙的产生了。 当然,神经元的参数调整依然高度依赖人的经验,这也是为什么说深度学习DL依旧还是一个充满Tricks(Yann LeCun语)的Dirty Work(Andrew Ng语)。 3、“人工”人工智能 目前实践中,接地气的人工智能方法,除了前面说的深度学习DL,还有马上讨论的“人工”人工智能。 2007年,一位谷歌的实习生路易斯?冯?安(Luis von Ahn)开发了一款有趣的程序“ReCapture”,却无意间开创了一个新的人工智能研究方向:「人类计算」。 ReCapture的初衷挺简单的,想利用人类高超的模式识别能力,自动帮谷歌公司完成大量扫描图书的文字识别工作。于是,Luis von Ahn想到,每天都有大量的用户在输入验证码来向机器证明自己是人而不是机器,而输入验证码事实上就是在完成文本识别。 于是,一方面是有大量的扫描的图书中难以识别的文字需要人来识别;另一方面是由计算机生成一些扭曲的图片让大量的用户做识别以表明自己的身份。那么,为什么不把两个方面结合在一起呢?Luis von Ahn聪明地让用户在输入识别码的时候悄悄帮助谷歌完成了文字识别工作! 大家再想一下前文中我们提到的图灵测试,在这个「人类计算」ReCapture的例子中,用人来帮助识别文字,是不是就是A和B合二为一,他们一起给C提供AI服务了。 世界就是这么神奇,人们探索人工智能AI一个多世纪了,虽然图灵机停机问题证明了目前现代图灵计算机的局限性,但是在「深度学习DL」和「“人工”人工智能」两个方向上依然砥砺前行。 期望有一天,「超越图灵计算」的量子计算和DNA计算也有理论和实践上的突破。 (责任编辑:本港台直播) |