比方说对于一些数据量非常之大,而且本身企业的处理资源很强的客户来说,很多的工作负载,特别是像需要全天候永续运行的工作负载更适合放在本地的物理机上运行,这带来的经济实用性更强,扩展性也更强。此外,由于受制法律上的要求,还有一些工作负载或者是数据的处理按规定是必须要放在本地的物理机当中来运行的。 在Cloudera,目前Hadoop业务的云模式占到了15%到20%。Cutting认为这一比例在未来会增长到40%到60%,但是不会到90%。也就是说,本地安装运行的模式仍然会是Hadoop业务的一个重要组成部分。 Hadoop在中国:用户习惯有待培养,教育计划正在起步 在访谈中,Cutting也特意提及了Hadoop在中国的发展状况。Cutting认为,Hadoop与中国市场之间有一个非常自然的契合和匹配。 从大数据出现一直到今天,中国一直是在大量使用和参与推进大数据的发展。而在过去十年当中,Hadoop在中国也是一直得到了大力推进,取得了非常大的成功。从数据的角度来说,中国可以说是世界上最大的单一市场,中国拥有数据数量和规模超过了世界上大部分其他的国家,这也就是为什么Hadoop在中国有着非常成功的发展。 然而,Cutting也注意到了中国市场与美国市场在用户习惯上的差异。很多中国的Hadoop用户仍旧习惯使用Hadoop的开源版本,而不需要去具体得到哪一家公司的支持和帮助。中国市场相比美国,仍然需要花更多的时间对市场进行教育和培育,也就是让人们能够了解到,在使用这些软件的过程当中如果能够得到有关方面的支持和帮助,从更加长远的角度来说会有更好的结果。 “这样的市场教育在中国可能是要花更长的时间,但是对于Hadoop在中国的发展前景我是非常有信心的。”Cutting自信地说道。 Cutting也注意到了以Hadoop教育为首的Cloudera学术计划在中国的起步,在这个计划当中,Cloudera把大数据培训的技能、教材、内容免费提供给大学合作伙伴,目前已有包括清华大学在内的多所高校参与了这一计划。此外,Cloudera也正在亚洲开展一个名为BASE Initiative(大数据分析技能培训计划)的教育项目。在这一计划中,Cloudera与大学、政府部门,和需要招聘大数据人才的公司一起合作,对潜在对象进行大数据技能的教育培训,并且招聘其中的一些人到有大数据技能需求的公司来工作。 大数据普及:卖产品只是开始,结构变化、人才培养才是关键 除Spark之外,Cutting也谈到了近几年大数据应用的普及。Cutting指出,各行各业的大数据项目当前保持着稳步持续地增长。自从Cloudera诞生以来,大数据的应用一直处在稳步增长的曲线之中,atv直播,而没有出现停滞不前或者是失去动力的情况。 大数据已经在多个领域取得了重大突破,直播,如反欺诈方面。另外即使在医疗领域,大数据也已经有了很多成功案例,比方说美国有一家公司Cerner开发了一套大数据系统,主要是来判断患者有可能发生败血症的情况。即使是在癌症治疗方面,大数据的应用也在取得更多的进展,比方说在基因组学的研究方面,以及在取得治疗癌症方面的进展。 然而,Cutting也告诉我们,大数据应用的普及是一个长期的过程,应该让每一家公司、每一个组织机构都能够用正确的方式用好数据,即使这需要花很长的时间。普及大数据应用不像卖智能手机,不是说把产品卖到人手一台,这个事情就完成了。大数据的普及,需要组织结构本身发生很大的变化,还需要很多的教育工作、人才的培养工作,但是这一切都是在稳步推进当中。 知识图谱vs统计学:谁是人工智能发展关键? 最后,对于知识图谱与统计学谁能引领人工智能发展的问题,Cutting也提出了他的看法。 (责任编辑:本港台直播) |