源码资本在2017年码会上宣布,前金山CEO张宏江博士加盟源码资本任投资合伙人。张宏江博士在2017年码会上分享了重磅观点“AI的本质与机遇”。 张宏江博士曾为前微软亚太研发集团首席技术官、微软亚洲工程院院长、金山软件CEO,是世界多媒体研究领域一流的科学家,是计算机视频检索研究领域的“开山鼻祖”,获得过IEEE(美国电气和电子工程协会)和ACM(美国计算机协会)两大计算机专业协会颁发的重大奖项,是第一位也是迄今为止唯一同时获此殊荣的华人科学家。 张宏江博士在2017年码会的演讲全文: 今天,我们从AlphaGo讲起。我们的议题包括这一波AI潮流的原因是什么,机器学习的驱动燃料——大数据的发展,深度学习的基本原理,AI技术的发展给我们的日常生活,给我们的创意以及工作带来什么样的影响。最后是投资AI领域有什么样的机会以及陷阱,尤其是陷阱我会多讲。 1、从AlphaGo说起AI潮流:算法+计算力+大数据 典型的深度学习算法就是深层的神经网络;AlphaGo在一场比赛中消耗的能量是人的300倍;数据爆炸在过去十年改变了我们的生活。 这一波人工智能的热潮其实是从去年AlphaGo与围棋大师李石世对决开始的;虽然我从来不会下围棋,但我下了赌注赌AlphaGo会赢。 为什么我会下这个赌注?我们读过关于AlphaGo的文章,其实它是一个典型的深度学习的系统,它用了深度的神经网络,还用了深度学习里面的强化学习,半监督学习,还用了蒙特卡洛搜索的方法。 整体来说是经典的技术和新的机器学习算法结合在一块,从而能够提高算法的性能,使它的学习能力更强。通过增加深度学习网络的隐层神经元数目从而建立起很好的学习能力,吸收知识的能力。这是算法上。 其实在这个背后还有非常重要的两条,这是过去几十年计算机发展带来的结果。 第一条,互联网过去20年的发展带来了大数据,而且是高质量的大数据。以AlphaGo为例,在它跟李世石对局之前已经跟人类六到九段的棋手对决过一万六千多次,这个中间他获得了超过3000万的布局点,这个对于它的能力提高非常重要。它跟自己下棋的过程中又获得了3000多万个布局点,同时形成它的决策网络。这是我今天讲的重点,就是高质量大数据这一块。 第二条,高性能的计算资源。如果我们看一下最终AlphaGo拿出来跟李世石对局系统用了1920个CPUs,超过280个GPUs。这是什么意思?我们知道一个衡量围棋大师的标准是一到九段,而更细的平级是用ELO这个数。 用了1920个CPU,280个GPU以后AlphaGo的能力,ELO数,从一开始两千多到了三千多,我们看李世石的数字是3500个,其实已经相当接近了。正是因为有了高质量的大数据,有了高性能的计算资源,有了新的学习方法,使得AlphaGo能够轻松地战胜了围棋大师。而且我们说到一点是,当李世石艰苦赢了第四局之后,这个时候AlphaGo当天晚上又自己跟自己下了一百万次。 为什么这次AI的浪潮跟前两次不太一样?今天我们谈的AI其实谈的是大数据小的新的算法。计算资源这些年发展下来,随着摩尔定律的指引,计算性能增加是快速的成指数的增加,同时计算的成本也是随着指数往下走的,计算资源越来越强,价格越来越便宜,从而我们可以廉价地利用大量计算资源。 过去十年的另外一个根本性的变化,就是如果你自己不想买计算设备,你可以用云计算。我们看云那一块,大数据的处理能力在云计算的平台上已经以标准云服务的方式提供给大家,大家可以很方便低成本地使用。这是另外一个在计算方面的进步,根本改变了在机器学习只是在大公司来做的状态,今天小公司可以用云计算来做了。 回头来讲数据,这是我特别喜欢的题目。在AlphaGo之前,我就一直跟大家讲大数据,当然心里面是想推广金山云。但是大数据确实在过去十年内改变我们的工作、改变了我们的生活,改变了我们的思考。 IDC有过一个报告指出,在2013年的人类产生数据是4.4个ZB,到了2020年的话这个数字将会增加到44个ZB,增加10倍,年增长率是40%。今天每4小时沃尔马用户产生数据超过2.5PB,每天Twitter产生推文有5亿条,今天今日头条的用户请求超过60亿次,每天头条处理数据量超过6.3PB,这是每天人们产生的数据。假如说这些数据又有很好的跟踪和标注,这些数据可以驱动人工智能,驱动人工智能的算法。 2、大数据:机器学习的驱动燃料 (责任编辑:本港台直播) |