不同的算法的性能会随着数据量变化产生的变化,当数据量增加的时候它的精度也在迅速提高。但是你可能会问一个问题,是不是现在我们有足够多的数据,从而我们人工智能就能够覆盖所有的场景?去年发生第一起特斯拉伤人的事件,说明即使特斯拉这样每天有几十万辆车在路上跑,但是数据依然不够,依然在有些情况下出现死人的事故。 如果做数据库的人不知道Jim Grey,那基本上不应该跟别人说是做数据库的。Jim Grey他在十多年前就提出了人类在做科研的四个不同的范式。过去最早的纯粹基于观察和实验,百年前的理论模型,几十年前开始的计算模型,到今天数据推动的模型。过去十年大数据进展非常快,大数据已经开始在企业里面大规模的进行运用了。 美国一个咨询公司调查了300家3000人以上的公司,基本上60%的IT公司都在使用大数据了,只是说使用层次不一样。最早期是统计发生了什么,后来分析发生的事情,到今天预测怎么样发生。未来,大数据将洞察什么样的决策是好的商业决策,再进一步的认知真正落实到行动上,也就是自我学习的能力了。 英特尔这样老牌的公司今天在疯狂并购做AI或者创作数据的公司,比如说两个月以前以天价并购了一家以色列公司Mobileye。原因很简单,英特尔认为汽车其实是人类生活中能产生大量数据的设备,这些数据能够帮助数据使用者给人画像、判断一些商业应用。而这一切产生的过程、处理的过程由英特尔控制,这意味着它控制了另外一个新的平台,这是为什么英特尔在这方面投入这么大的资本。 讲完了计算和大数据。再回到一开始的所说的算法的进展。 3 深度学习的基本原理 大数据驱动的深度学习方式,是机器自主学习; 深度学习第三次浪潮的特征:大数据+强计算+新算法。 AI做了60年,终于迎来了第三次浪潮,这次浪潮看起来比前面两次浪潮来得更猛烈,而且解决的问题比以前更多。很重要的是,我们用的深度学习的方式与传统的专家系统方式有很大的不一样。专家系统的方式是人总结规则,然后把规则交给机器,机器来开始利用这个规则面对使用场景。深度学习方式,大数据来驱动的是机器自己来学习的。好处是机器本身具有学习能力,所以可以较容易地从一个应用扩展到另外一个应用。 过去的十年,恰恰是深度学习迅速发展的十年。2006年Hinton在Nature发表文章,标志了深度学习这个词诞生。2010年随着大数据的爆发,深度学习热潮开始兴起。2012年Hinton这个团队用CNN模型以超过第二名10个百分点的成绩夺得当年竞赛冠军。到了2016年的AlphaGo,人们对深度学习的能力没有怀疑了,深度学习将会改变人类,这是一个新的时代的到来。 深度学习,到底是什么样的东西?神经网络这件事其实在第二次浪潮(80-90年代)就已经开始了,大家已经用过了,80年代-90年代初,神经网络泛滥的一塌糊涂。那个时候数据量不够,就是输入层、输入层、隐含层。另外一个根本改变是今天的设备、速率如此之强大。 为什么深度学习方法不一样了?首先是一开始的原理就是神经网络,类似大脑的思考原理。人类大脑大概有1000亿个神经元,在这些神经元之间有超过一百万亿的连接。神经元的数字还有连接的数字,是人智力很重要的标志。一个具体的神经元就是有一个核加上一个突触链,我们根据这种原理做模拟神经元。并且将它跟别的神经元的连接。经过一个非线性的函数,从而转成一个输出。输出的信号就是你所需要的结果。当神经元多了的时候,或者层数多的时候显然需要的训练数据就要更多。 为什么大数据实际上是深度学习驱动力?以前模拟系统来做的神经元,用物理模拟机器来做这个复杂度,不可能做到一亿的神经元,不可能做到一百万亿的连接。但是今天我们用计算机能够做到。深度学习是什么意思?很简单,深度学习就是层数比较多的神经网络。每一次训练你输出一系列的数据,当实际输出和目标函数有一定的差距,这个差距反馈回去再进行训练,这是整个循环的过程。 4 AI的发展与影响 AI的应用与未来:辅助人,代替人,超越人; 机器将造成未来社会出现90%的闲人,但机器难以替代资本家、艺术家和手艺人; 机器在感知上超越了人类,但在认知上还要5-10年。 (责任编辑:本港台直播) |