对于数据清洗,最基础的主要是行过滤与列过滤,这通过Data Pipeline的前端界面就可以进行选择,当企业对数据清洗的要求更为复杂时,Data Pipeline开放了API接口让企业进行编程,满足自定义的需求,对数据质量也有了一定的保障。 由于Data Pipeline采用容器技术进行私有化部署,不仅降低了部署成本,atv,而且使得部署效率接近公有云部署,几个小时就能完成;Data Pipeline也支持混合云、跨云的部署模式,为了保障安全,非私有化部署时会进行加密处理。 整体看来,Data Pipeline操作起来比较简单。事实上,当企业选择数据集成商时,一方面会对数据集成有业务、能力方面的要求,另一方面又希望能尽量减少产品的培训使用成本,所以将集成技术产品化,并尽量把界面做得友好,更容易被企业所接受。如陈诚所说,“企业花80%的精力去做数据处理(doer),就只剩20%的精力去做数据分析(thinker),我想转变企业的这种身份。”这也正是为了让企业把核心资源放在自身业务上。 想做的维度很多,现阶段重点是深度 从2016年3月开始创业,到6月获得峰瑞资本的数百万元天使投资,Data Pipeline在当前的产品形态下,已经积累了近10家种子客户,主要分布在社交、电商、零售、金融四个行业。Data Pipeline按照其占用的服务器收取年费,目前已经有了付费用户。“客户对我们很包容,但商业场景下没有人会为人情付费。”陈诚笑言。由于Data Pipeline提供了较为稳定的产品技术,迭代速度和处理客户反馈的速度很快,所以得到的评价也不错。 如果要对目前的Data Pipeline进行评分,陈诚认为很难回答,因为他心里的产品在将来还有更多可以去探索的点,比如从数据异常监测等角度去关注数据质量。作为一家以技术为核心竞争力的公司,Data Pipeline所瞄准的是整个数据产业链的第一步。“我们目前的定位很简单,只做这一块。”陈诚表示也许将来会做成全链条,从一家产品技术公司成长为纯技术公司,开奖,中间还需要很长的积累过程。如果客户需要一站式的打包方案,Data Pipeline会跟上游、下游的厂商进行合作,用多个产品为客户提供解决方案。 Data Pipeline的发展并不依托于行业,要做深度主要是聚焦在产品技术与产品细节上,陈诚认为成功是可以复制的,“我们现在的重点是找到几家头部公司,在前期把客户案例做好。”寻找广度是扩大规模时该考虑的事情。 而Data Pipeline2017年开拓市场的重点,一方面是品牌推广,“在技术驱动的同时,把以客户为中心的理念传递出去。”另一方面是产品销售,Data Pipeline的联合创始人毛海英曾是用友大客户总监、SAP华中地区销售负责人、前优医库CEO,拥有丰富的B端销售经验。 国外已经有很多标杆企业在提供数据集成服务,其中,Informatica 还连续 11 年被 Gartner 数据集成工具魔力象限评选为领军企业,而国内有像东方国信这类传统的集成商占据主要市场,华为、亚信等企业也在提供相应的解决方案。“传统的数据集成方案价格高昂,可扩展性和处理实时性差,没有办法满足现代企业需求。”峰瑞资本早期项目负责人朱祎舟侧重人工智能、数据服务领域的投资,他十分看好Data Pipeline的产品理念,“只有提供更灵活、更实时的数据聚合服务,才能为企业数倍地提高效率。” 笔者认为,站在头部行业的大公司,虽然大都有充足的IT预算与专业的IT团队,有能力投入大笔资金去选择可全方位解决问题的数据集成产品,但是为了把更多资源放在核心业务上,需要调整好数据战略。如果Data Pipeline可以提供轻量而高效的技术产品,并且有好的产品革新能力,也会有能力在这个行业中初步打开局面。 再者,Gartner在相关报告中预测,到2020年,全球数据集成市场收益将达到约40亿美元。当数据服务不再只是头部行业的专属需求时,这个市场给了更多新兴技术公司生存发展的空间。只是在这条赛道上,数据服务提供商们要拼的不是只有价格这么简单,而是技术的质量和切入的角度。Data Pipeline作为一个有十几人的年轻团队,从整个链条的第一环出发,有自己的一套数据管理方式,在未来的某个节点也许会展示出自己的底蕴。 (责任编辑:本港台直播) |