我们讲到的这四大类数据资源看起来多,但现在所有使用数据的人都会有一个感觉,当你真正用数据的时候,你会发现找不着数据。而另一方面,我们看到一些拥有数据的企业,特别是有巨大价值数据的企业,比如:运营商和BAT等,它们自身的数据都是大家所觊觎的对象。但这些企业对把它们的数据最大程度地公开和开放的诉求或者动力目前还没有那么大。这就造成一个现象:我们感觉数据很多,但是当我们真正想用数据的时候,你会发现找不着。所以,整个大数据产业要想快速发展,就需要解决基础数据源的问题,这是将大数据产业很快做到一定规模的根本性问题。
实际上,国内做数据流通并不是一件新鲜事,尽管这几年看起来异常火爆。从国家层面,包括科技部、中科院以及国家的一些部委在若干年前就已经做了一些科研或者是科学领域的数据共享开放的工程和项目。这些共享平台在我看来应该就是国内数据流通的一种很早期的形式,尽管发挥了很大的作用,但是从商业价值或者商业模式的角度来看,似乎影响也并没有那么大。因为这些平台都是以国家财政补贴或者是财政支持的形式来做的,所以从一开始就没有考虑到可持续的商业模式,因此一直是以半官方的形式在运营。这样就导致整个平台上的数据资源,包括开放的活跃度以及后面产生的商业模式等看起都是有问题的。我们需要考虑的是如何以一种可持续的商业模式来做数据共享和数据流通。
目前,国内数据交易现状还是多种形态并存的状态。总的来说,其实数据共享的形式很早就有,但是这种线上线下的数据交易还是在这几年悄然生长的。用一句古诗形容就是“落霞与孤鹜齐飞,秋水共长天一色”,即现在各种数据交易的形式都有。我认为这些交易中心或者交易平台实际上对早期的大数据发展还是起到了非常大的促进作用,毕竟我们可以通过这些平台来发现一些原来我们根本接触不到的数据,它解决了大数据产业最早期阶段的数据需求,这相当于解决了“马斯洛层次需求理论”中最底层的需求。但是从现在各个数据交易所或者数据交易平台的发展情况来看,这里面还是存在一些问题,比如:数据交易过程中的原始数据能否标准化的问题;数据交易过程中的版权问题等。 从用户使用数据的角度来看,很多用户需要的并不是真正的原始数据,他们需要的是加工处理或者是半加工、半分析过的半成品数据。另外,根据我们这几年的经验来看,假如数据真正开放或者流通以后,并不是所有人都能无障碍或者无门槛的去使用这些数据。实际上数据对使用者还是有一定的技术要求的,或者是要有一定经验才能够去使用的。
所以,从以上几个因素及问题来看,直接交易原始数据的形式至少从现阶段看来还不是一个成熟的形态。原始的数据交易只能解决一些小问题,如果想让这些数据转换成各种价值,还需要有将这些数据转换为一种服务的形态才是正道。这就是我今天讲的主题:数据流通,服务为本。 数据流通,服务为本
什么是“数据流通,服务为本”呢?我们日常在家里用水的时候,你从来不用关心水龙头里面的水是来自于哪个水库。所以我们会畅想,在未来使用数据的时候,是不是也能像使用自来水一样,不用去想那么多,直接是“随用随取”的形式。因此,我们提出了“数据即服务”的模式,我们想通过这种模式将数据拥有方和数据需求方以一种无障碍或者是降低门槛的方式,将两端的需求和资源对接起来,而不是简简单单的通过数据交易来解决大数据产业发展过程中的一些问题。“数据即服务”这种模式需要考虑几个重要环节: 第一、数据从哪来?就是解决数据采集和获取的问题。 第二、要解决数据标准化问题,即拿到数据以后我们要做一些加工、清洗、处理,甚至要做一些关联融汇。 第三、将数据封装成可以便捷使用的数据产品服务,并推广出去。 (责任编辑:本港台直播) |