如你所知,追溯历史,踩在某些意义深远的技术普及之前,这个世界上的科技巨头往往在合适时机选择开源一些产品,促使社区和整个行业进步——种种迹象表明,最新一轮开源运动来自人工智能领域,就在此刻,全球最顶尖的科技公司正掀起一场“AI技术开放”共享风潮。 时至今日已没太多人怀疑,人工智能是新一轮产业革命的土壤,人类社会也正在从“互联网+”向更高阶的“人工智能+”跃迁,而从专业视角,当人工智能(目前以深度学习为最佳路径)以更为务实的姿态蔓延到一个又一个行当,这也意味着代码开源将变得日趋重要。毕竟,人工智能作为未来数十年科技世界的底层基础设施,在面对具体乃至细碎的应用场景时,任何巨头都做不到无远弗届,开放共赢是更聪明的选择。 于是在不少人眼中,颇为类似九年前Android开源对智能手机格局产生的影响(直接导致移动互联网时代的尽早来临),深度学习平台开源也会对人工智能的未来起到关键作用,而不同于谷歌在如今开源领域的一家独大,现在看来,“AI技术开放”似乎不太可能赢家通吃——事实上,包括谷歌,微软,亚马逊,Facebook,雅虎,IBM在内,最近一两年,几乎所有巨头都发布了自家的深度学习(或者机器学习)框架,在不久前的百度世界大会上,百度首席科学家吴恩达也宣布开放其内部研发的深度学习平台PaddlePaddle,让国内人工智能也步入开放时代,考虑到百度之于中国人工智能行业的地位,这一举措在人工智能圈层引发了诸多热议。 更宏观层面,“深度学习开源平台能否成为下个Android”的探讨无疑更为惹眼。在我看来当然有这个可能,而若你相信人类科技指数级演化的趋势,相比Android的体量,人工智能开源平台在未来能否构建出一个更复杂的生态系统也未可知。 各自开放 廉价的并行计算,更好的算法,以及更大的数据量,让六十年来不断幻灭又重燃希望的人工智能时代近在咫尺。而与Android一样,全球各地的开发者无疑是一股无法忽视的力量,开源即是吸引他们的重要途径,他们的加入或将成为科技巨头们抢占人工智能风口的最大变量之一。也因如此,atv,巨头纷纷将已在内部发挥重要作用的知识结晶开源。 先说谷歌。去年11月,他们开源了名为TensorFlow的机器学习平台,这是谷歌开源的第二代人工智能系统,惯性使然,媒体当时就将此举解读为“复制人工智能领域的Android”。事实上,TensorFlow是一个用来编写和执行机器学习算法的工具,工程师和研究者能借此打造分析图像和语音等数据的系统,计算机在此类系统帮助下能自行作出决定,从而变得更智能。值得一提的是,谷歌已将TensorFlow用于Gmail,搜索,图片,atv,翻译器等超过50款谷歌产品,如今他们希望更多人的使用能放大其价值。 Facebook的开源路径似乎更为激进。去年1月,Facebook人工智能研究院推出了一组基于Torch机器学习框架的开源深度学习工具,这之后,去年12月,他们又开源了Big Sur人工智能硬件架构——而就在不久前,Facebook又宣布开源了一系列 AI 软件,可以识别出照片里物体的种类和形状。 不甘为后的还有亚马逊。去年4月他们推出Amazon Machine Learning,一项托管服务,能让任何开发者轻松使用历史数据开发并部署预测模型——要知道,亚马逊一直用机器学习完成诸如过滤垃圾评论,通过姓名辨别用户性别等细碎任务。 响应开源运动的还有那些看似不在聚光灯之下的传统IT巨头,譬如微软就将分布式机器学习工具包(CNTK)开源,后者主要用于自然语言处理,譬如文本分类与聚类,话题识别以及情感分析。当然还有IBM,几乎与TensorFlow同时,IBM宣布开源机器学习平台SystemML,这是IBM研发超过十年的技术,大名鼎鼎的沃森(Watson)就整合了不少SystemML的功能。 再来看百度。事实上,早在2013年的时候,百度深度实验室就察觉到,在深度神经网络的训练上,伴随着计算广告,文本,图像,语音等训练数据的激增,传统的基于单GPU的训练平台已无法满足需求,实验室为此搭建了这个多机并行GPU的训练平台。PaddlePaddle已持续开发了三年时光,并被部署到百度30多项产品或服务中,譬如外卖的预估出餐时间、预判网盘故障时间点、精准推荐用户所需信息、海量图像识别分类、字符识别(OCR)、病毒和垃圾信息检测、机器翻译和自动驾驶等领域。 (责任编辑:本港台直播) |