百度吴恩达的离职让 AI 成为热点话题,人工智能(AI)在无人驾驶、医疗、金融等领域的应用给未来商业生态带来了无尽遐想。中国在这波 AI 浪潮中占有什么样的位置?云服务等基础设施在未来 AI 中将扮演什么样的角色?在国内的 AI 创业中,AI 是噱头概念、还是真实可触的现实? 2017 年 3 月 22 日,在以色列举办的 GMIC 全球移动互联网大会上,前金山 CEO 张宏江博士接受了界面新闻记者专访,阐述了自己对 AI 的理解。张宏江毕业于丹麦科技大学,获电子工程博士学位,曾是微软亚洲研究院的创始人之一、金山 CEO。 张宏江认为,AI 的下一步高速发展离不开三个主要条件:数据、更快的硬件和更普遍可用的算法。 随着全球设备、机器和系统的连接,大量的无结构数据被创造出来;神经网络有了更多的数据,就变得更为有效。手机、IoT 、低成本数据存储和处理(云)技术的成熟使得可用数据集的大小、结构都有了极大增长。 例如,特斯拉收集了 780mn 英里的驾驶数据,而且通过他们的互连汽车,每 10 小时就能增加 100 万英里的数据。此外,Jasper 有一个平台,能让多家汽车制造商和电信公司进行机器间的交流,这家公司于今年 2 月份被 Cisco 收购。Verizon 在 8 月份做了类似的投资,宣布收购 Fleetmatics。Fleetmatics 做的是将汽车上的远程传感器通过无线网络连接到云软件。 未来,5G 网络的上线将会加速数据生成与传输的速率。据 IDC 的 Digital Universe Report 显示,年度数据生成预期到 2020 年达到 44zettabytes,表明我们正在见证应用这些技术的使用案例。 与之类似的还有硬件成本的降低。GPU 的再次使用、低成本计算能力的普遍化,特别是通过云服务,以及建立新的神经网络模型,已经极大增加了神经网络产生结果的速度与准确率。 GPU 和并行架构要比传统的基于数据中心架构的 CPU 能更快地训练机器学习系统。通过使用图像芯片,网络能更快的迭代,能在短期内进行更准确的训练。 同时,特制硅的发展,比如微软和百度使用的 FPGA,能够用训练出的深度学习系统做更快的推断。另外,从 1993 年开始超级计算机的原计算能力有了极大发展。在 2016 年,单张英伟达游戏显卡就有了类似于 2002 年之前最强大的超级计算机拥有的计算能力。
在数据和计算能力大幅提升背后,算法是配套设施。 更好的输入(计算和数据)使得更多的研发是面向算法,从而支持深度学习的使用。例如伯克利的 Caffe、Google 的 TensorFlow 和 Torch 这样的开源框架。比如,刚开源一周年的 TensorFlow,成为了 GitHub 上有最多 forked repositories 的框架。虽然不是所有的人工智能发生于普遍可用的开源框架中,但开源确实在加速发展,而且也有更多先进的工具正在开源。 总结起来,AI 兴起背后的本质原因是大量数据的产生:从 2013 年到 2020 年,数据将以每年 40% 的速率增长:传统零售巨头沃尔玛每 4 小时产生 2.5PB 级的数据量;推特上每天的推文量在 5 亿条左右;今日头条每天要完成 6BT 的请求、完成 6.3PB 的数据处理量(1PB=1024BT)。 下图展示的是最近几年各个应用软件图片上载的情况:
张宏江认为,中国因为人口众多,在数据来源、AI 产业上的能力是不输发达国家的,目前处于各自在发力狂奔的状态。 张宏江目前比较看好的两个国内 AI 创业项目是 Face++ 和今日头条,代表了两个不同的 AI 创业方向:Face++ 是人脸识别技术服务提供商,通过 AI 训练提高人脸识别的精准度,业务做得较早,建立了行业门槛;今日头条则是从行业本身出发,把新闻推送业务做起来,atv,再把 AI 放进去改善产品。这是两种完全不同的发展模式。
张宏江认为,中国因为人口众多,在数据来源、AI 产业上的能力是不输发达国家的,目前处于各自在发力狂奔的状态。 张宏江目前比较看好的两个国内 AI 创业项目是 Face++ 和今日头条,代表了两个不同的 AI 创业方向:Face++ 是人脸识别技术服务提供商,通过 AI 训练提高人脸识别的精准度,业务做得较早,建立了行业门槛;今日头条则是从行业本身出发,把新闻推送业务做起来,j2直播,再把 AI 放进去改善产品。这是两种完全不同的发展模式。 #欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。 爱范儿| 原文链接· · 新浪微博 (责任编辑:本港台直播) |