马化腾介绍说,腾讯作为一家做社交网络的公司,微信里拥有大量的人脸数据,每天微信里的人脸图片高达10亿张,目前腾讯在对这些数据进行基础性研究,包括后台数据分析等,都用到了人工智能的技术,在前端也做出了一些产品。 谈及腾讯在人工智能战略上的布局思路,马化腾总结了四个方面: 第一个是场景。场景就是你想把这个技术应用在什么场景下,你是不是有高频的跟用户接触,这是一个落地的很重要的地方。所以我们看到很多研究院也好,包括我们内部研发团队。如果没有场景落地,没有平台支持,基本上就是空中楼阁,研究一半很难往下走。 第二个是大数据。大数据也是从平台、业务部门有大量实际运转数据才能产生出来。但是这里面很多大数据是垃圾数据,因为没有标签,每人做规划定义,用多好的算法也学不出来,学出来也是走火入魔,没有用的。数据清洗、标签化难度非常高,我们甚至要雇佣很多人用人手的办法,先用人脑清洗干净,再让AI学习。这里面是一个混合结合的过程。 第三,计算能力,也就是云资源,几十万核的计算能力,CPU、GPU,我们还是有这个能力的。而且在云里面本身就可以很好的调用,这是我们第三个优势。 第四个,一年前我们比较缺乏的就是人才。通过一年我们也招了挺多的人,我们在微软的西雅图研究院旁边也设了一个实验室。因为很多微软的人不愿意离开西雅图,所以我们就在旁边设,没有办法,人才就是这样。几个方面结合起来才有办法真正在某一个领域看到它的成效。 关于腾讯社交平台的大量数据开放政策,“这个我们内部还在激烈讨论”。 我们现在观察到很多的AI所谓的大拿们,他们更关注怎么落地,能不能把毕生研究成果能够体现出来,所以在我们内部在吸引人才的时候,往往也会说你们微信、手机QQ里面的平台数据能不能给他们用,但是事实上大家都知道,BG、部门里面的平台他们也很希望近水楼台先得月,数据就在我身边流动,我为什么不能招人先研究一把,为什么给你呢。 我们现在还处在内部怎么把数据分享出来这个阶段。当然这里面还有一个用户很关注的个人隐私,别把我的数据都卖了,到时候大家都知道,这里面还有一个很复杂的信息安全个人隐私脱敏,你是不知道无法根据数据倒推到哪一个人做了什么事情,我们要把这些处理干净才能往下一步谈。这里面数据清理到什么标签,才能给其他部门、包括外部合作伙伴怎么用。同时有很多数据来自合作伙伴,业界其他公司,他们也遇到这样的问题那者一堆裸数据不怎么用,这样业界还要有一个标准,互惠互利交换,这是一个大方向,还有很长的路要走。 李彦宏谈格局:人工智能堪比工业革命 在一些关于人工智能产业方向和应用等问题时,李彦宏的观点和看法十分透彻,对于人工智能的发展水平偏向保守。李彦宏认为,人工智能不可能是仿生学,偏向应用导向。人工智能只是像是人脑的工作原理,但我们对人脑只了解3%,所以根本不知道怎么去仿。 他认为,人工智能的算法还处于初级阶段,真正挑战人的认知能力还有很长时间,实际上也不可能。人工智能发展会有弱人工智能、强人工智能和超人工智能三个阶段,即使是在超人工智能阶段,还是用电脑的方法模拟人脑,但永远达不到人脑的水平。 对于百度很早就投入深度学习的原因,李彦宏表示,百度的基因是做搜索,搜索实际上是机器理解人想要的东西。2012年左右,陆奇还在微软,他说深度学习快要到应用阶段了,我们分析深度学习在图像搜索是偶然还是趋势,发现不仅对图像有用,对计算机的大多数领域都有用。 数据越来越多,计算资源越来越便宜,人工智能有60年历史,前50年为什么人们都认为没用,自己读书时就喜欢,但被告诉没用,未来找不到工作。但最近没用的变成了有用,市场环境变了,人工智能代表着未来。 2013年1月,百度成立了深度学习研究院。2013年自己以前一直讲百度是商业公司,不该成立研究院和研究机构。但深度学习起来之后是完全不同的,需要理论、算法的布局。算法、芯片、都需要重新审视,来适应深度学习的需求。 (责任编辑:本港台直播) |