本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

报码:数据准备工作是个脏活累活,Datablau要帮企业自动搞定

时间:2017-04-15 07:58来源:668论坛 作者:118KJ 点击:
数据作为企业的一项重要资产越来越被重视,而在对数据进行分析之前,需要做大量的数据抽取、处理、整合工作。这个准备工作是个脏活累活,却非常关键。 上规模的企业往往有上

  数据作为企业的一项重要资产越来越被重视,而在对数据进行分析之前,需要做大量的数据抽取、处理、整合工作。这个准备工作是个脏活累活,却非常关键。

  上规模的企业往往有上百个业务系统、数据库,以及成千上万份表单,数据环境十分复杂。不同IT厂商的数据技术、设计思路不同,导致每个数据集独立存在,无法互通。以前,企业关注的主要是业务,只要系统稳定不宕机就行了。而大数据时代,数据只有流通、碰撞才能产生价值。企业如果想进行数据关联性分析,需要业务人员和IT人员一起,根据需求对数据进行对应、分类,并编写脚本进行提取和关联。如果沟通不畅导致提取的数据不准确,还得重新开发。Gartner曾指出,这项工作往往要花费企业80%的时间。

  36氪近日接触的Datablau,主要针对这个问题,为企业提供用户数据管理方案,通过技术手段将数据的IT属性和业务属性相融合,节省企业人工开发、整合、沟通的时间。公司今年2月宣布完成数百万元天使轮融资,投资方是跨境投资机构美国中经合集团。

  企业存量数据的总量代表大数据,但此前其各个业务的数据集彼此独立。如果企业想了解不同系统间的数据整合在一起能产生什么价值,必须将按照业务逻辑重新拉通。

  Datablau充当的就是数据科学家的角色,既有IT知识,又了解企业业务。Datablau会先了解企业有哪些存量数据,再从不同数据库,将不同结构的客户、内部流程、运营等数据进行抽取并脱敏,通过预定义标签以及企业的有概念,将数据按标签梳理归类,产生数据资产目录和面向业务数据虚拟集。

  Datablau主要针对大型客户做私有云部署。企业安装部署Datablau后(一般3~5小时),IT人员将各数据源与平台对接,动获取或手动设置存量/增量数据模型后,系统就能自动进行数据梳理工作,按照业务概念将数据分类归档。

  与Datablau类似的,国外有Trifacta、Paxata、Tamr等。不过,数据准备在美国已比较成熟,中国市场接受程度普遍还不高。原因是,尽管数据准备是大数据分析的必经之路,但短期并不能给企业带来直观的效果。据王铮估计,目前国内有足够能力用好这套技术的不超过1000家企业。他也在探索适合中国市场的商业模式,同时不放弃国际市场。国内一些数据分析公司,如GrowingIO、神策数据、诸葛IO等,主要是针对用户行为数据,Datablau主要是按照业务逻辑拉通企业的存量大数据,更偏后端。

  Datablau于2016年投入研发,atv,目前1.0版本已经发布,试用客户包括eBay、国家电网、北大智慧城市等。

  团队方面,目前共10人,主要是技术和销售。创始人王铮2005年北京大学毕业,曾任ERwin全球研发负责人、CA技术开发部主任,atv,在数据建模领域有10年经验;CTO朱金宝是前ERwin总架构师,10年ERwin研发经验;首席咨询顾问刘晨拥有IT行业12年以上、数据治理领域8年以上从业经验;首席科学家丁贵广是清华大学软件学院副教授、清华大学软件学院副院长、博士。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容