诸如Cloudera和Hortonworks之类的厂商在激烈的机器学习市场面临艰巨任务,因为数据引力在日益偏向云这边。 机器学习和密切相关的人工智能眼下可谓风头甚劲,这绝不是什么秘密。实际上,它们实在太流行了,许多公司日益粉头饰面,给非智能型的应用程序冠以“智能”的名号;Cloudera首发上市当天的估值之所以那么高,atv直播,一方面就是由于它能够将Hadoop传统打造成机器学习未来。 然而一个更重要的问题是,正在取代企业数据中心、接管大数据部署项目的同样一些云服务商会不会最有可能成为机器学习大战中的赢家。早期迹象表明,答案是“肯定”的。 Hadoop带来机器学习 对于仍然认为Cloudera、Hortonworks和MapR是Hadoop公司的那些人来说,这种想法太老土了。由于这个市场发生了演变,不仅仅围绕普通的“大数据”,这些公司的定位也随之发生了变化。正如Cloudera的联合创始人兼首席战略官迈克·奥尔森(Mike Olson)在该公司为上市而提交的S-1文件中写道,最显而易见(可能最卓有成效)的切入点就是机器学习:“为管理云端大数据而构建的同样系统也可以为众多企业发掘机器学习的力量。” 机器学习已经存在了数十年之久,但是直到最近,我们才拥有成本低得足以让机器学习成为一个大众市场企业现象的软件和系统。就Cloudera而言,它全力投入这个领域:提交的S-1文件提到机器学习多达83次。Hadoop提到了几次?只有区区14次。 考虑到Cloudera想要兜售的是商业价值,而不是技术,这种转变不无道理。不管怎么说,考虑到Hadoop不再是Hadoop,一味地推销Hadoop越来越变得毫无意义。看看Hadoop生态系统里内部,你就会发现许多的Spark、Kafka、Impala以及其他的新颖部分,但是正如格温·夏皮拉(Gwen Shapira)着重强调的那样(https://twitter.com/gwenshap/status/796558207175032832),没有一个是“Hadoop”。 谁赢得机器学习之战? 正如市场调研机构Ovum的分析师托尼·贝尔(Tony Baer)所说,对于Cloudera、Hortonworks、MapR、IBM以及另外每家想在机器学习市场大有作为的厂商来说,真正的问题不在于“Spark vs Hadoop”,或者以另外某种方法对我们的数据提出问题。他表示,实际上是“云 vs Hadoop”这个问题,或者在机器学习这个背景下,这是涉及数据将驻留在哪里、哪些厂商最有能力提供数据的问题。、 鉴于数据引力(data gravity)――这个概念是指服务和应用程序会趋向数据“诞生”的地方,有理由认为:像Cloudera和Hortonworks这些比较传统的厂商在机器学习和人工智能的未来中会扮演重要的角色。原因何在?因为大多数企业数据驻留在企业数据中心里面,而不是驻留在云端。 不过,眼下还没成气候。 针对沉淀在数据中心的数据,开奖,AWS提供了Snowmobile,这种18轮大卡车一次性就能移动100 PB的数据。要是觉得这似乎很奇怪(确实有点奇怪),不必担心:应用程序日益驻留在云端,数据也会驻留在云端。 这显然是证明公共云提供商从长远来看称霸机器学习领域的一个明确的理由。当然,也有Cloudera之类的公司认为其产品是“为公共云基础设施设计的”。以Cloudera为例,其18%的客户已经在公共云端运行软件。据Hortonworks的首席执行官罗布·比尔登(Rob Bearden)声称,而在Hortonworks,在公共云或混合云环境中运行的客户占到了20%至25%。 然而,Cloudera能提供的东西与AWS提供的东西还是有区别。前者提供了在云端运行的软件,但是让企业的IT部门“积极部署、打补丁和管理云实例,就像他们在数据中心中所做的那样,”贝尔指出。他认为,对于天生拥有“主场优势”的AWS或微软Azure而言,机器学习服务是“全面受管理的――消除了打补丁之类的棘手问题。” 这就意味着,随着时间的推移,相比无法与其基于云的原生服务相匹敌的那些厂商,公共云提供商可能会从大行其道的机器学习获得更大的好处。在这个全云世界,竞争很激烈。据Algorithmia的首席执行官迭戈·奥本海默(Diego Oppenheimer)声称,“谷歌最备受信赖,这得益于它拥有众多工具;微软实际上能够说服企业,相信它有搞机器学习的能力;亚马逊则具有天然的优势,原因在于云端的大多数企业数据其实放在AWS云上。这是任何人都有戏的比赛。” (责任编辑:本港台直播) |