中国计算机学会青年计算机科技论坛(YOCSEF)委员,中国指挥与控制学会数据处理与集成专业委员会委员,北京大学信息管理系业界导师。 【关于数据堂】 公司成立于2011年,数据堂(股票代码:831428)为国内首家大数据上市公司,致力于成为全球最大的数据资源运营商,成立以来总融资额3.5亿人民币,当前估值30亿人民币。秉承“专注数据,共享价值”的服务理念,数据堂旨在融合和盘活各类大数据资源,挖掘数据价值,为客户产品和服务增值,为社会发展和进步献策。 数据堂创始及合伙人来自Stanford University、NEC、腾讯、华为等知名高校,互联网和高科技公司。数据堂在非结构化数据处理、大数据云服务等方面拥有国际领先的自主核心技术,50%以上的员工从事创新、研究与技术开发工作。目前数据堂拥有5家全资和控股子公司,并在硅谷下设美国子公司。 以下为分享内容: 今天和大家交流的主题是“数据流通,服务为本”。为什么选择这个题目呢?因为现在大数据产业发展到这一阶段,数据源,特别是数据交易、数据流通对于整个大数据产业的发展起着越来越重要的推动作用。 大数据产业生态初具雏形
首先来看一张大数据产业生态图谱。目前整个大数据产业的发展现状是:大数据产业生态已经初具雏形。其中有几个典型特征: 第一、各个链条上的产业分工逐渐清晰。 第二、底层的数据收集、数据源,中间的数据管理,以及上层的大数据应用等各个领域都已经有了一些代表性的机构或者公司。
总体来说,大数据产业的发展还是处于非常早期的阶段。大数据产业由于分工相对比较细,看起来各个板块之间是相对比较清晰的。另外,大数据的变现还没有到一个很成熟和爆发的阶段。所以,在现阶段由于生存的压力,各个产业图谱上的大数据厂商和机构的位置并不固定。其中会出现一些比如做数据源的会往做大数据应用领域走,也有会有做大数据应用的往数据源这边走。另外还有一些做大数据基础设施的厂商,会和中间的比如做可视化的数据厂商,它们的位置会出现一些腾挪或者是互相观望的状态。大家在做了大数据产业以后,会感觉到自己做的事情没有那么容易赚到钱,所以就会看看其他人是怎么赚钱的。现在的大数据产业就是在混沌中各自寻找自己的位置,找到让自己有安全感或者是能爆发的位置。
在整个大数据产业链分工比较清晰的情况下,因为大家都需要数据资源,所以整个大数据的资产和价值属性开始凸显。其中有几个比较典型的特征:第一、各个地方纷纷成立各种大数据交易所和大数据交易中心;第二、我们可以从各个渠道上看到各种各样的数据在流通、交易。总的来说,21世纪是一个数据为王的时代,数据的价值等同于20世纪的石油。数据是大数据产业的关键资源,数据正在颠覆各个行业的发展模式。
大数据的现状与困境 目前,整个数据流通或者是数据交易市场看起来是比较火热的,这种火热反映了大数据产业的发展现状和困境。大数据现状与困境在于,一方面我们感觉数据很多,比如:行业数据、政府数据、互联网数据、纯线下数据。 第一、行业数据。在这四种数据类型中,行业数据目前的流通情况相对来说是最好的; 第二、互联网数据。互联网数据的流通性也比较好,因为大部分是公开的,我们可以利用爬虫或者是其他工具获取大量的互联网数据; 第三、政府数据。政府数据目前的开放程度相对比较弱,但是我们最近也看到了一个趋势,由于国家鼓励各地方政府部门去开放和共享他们的数据,所以现在大家也可以看到各个地方会有一些数据开放共享平台出来; 第四、纯线下数据。比如:线下的商品、饭菜价格的数据等,这种数据看起来比较分散,也不太容易集中利用。 (责任编辑:本港台直播) |