在这个万物普遍联系的世界里,指数是通过大数据去认识世界的先头部队。 演讲者|涂子沛(微信号:涂子沛频道) 11月8日,南都指数联盟发展论坛暨首期指数产品发布会在穗召开,大数据专家、观数科技联合创始人涂子沛应邀发表了题为《认知社会:发现指数的时代价值》的演讲。 以下内容根据涂子沛演讲整理: 很高兴来到这里跟大家一同见证南都指数的发布。 指数其实无处不在。前几天我在外地出差,回到酒店看到台子上摆了一张纸,叫天气指数。天气需要一个指数吗?还真需要,它列出了2016年11月6号天气有多少种可能,来告诉你明天是什么温度,应该穿什么衣服。 为什么需要指数?因为我们面对的世界纷繁复杂,我们面对的世界在不断变化,我们人类想把握变化,认识世界。 指数是什么?是复杂社会经济现象一个总体综合变化的一个相对数,它有很多作用,监测社会经济、评价政策效果、考察计划进程、引领社会生活。 我想简单地来介绍一下我心目中的两种指数。 第一种指数就是类似于天气指数这种简单化的指数。比如说2007年李克强在辽宁当书记的时候,他推出一个克强指数,受到了全社会的认可。三个数据加总就能标志经济的发展,透过万千的乱象看到本质。 还有摩天大楼指数,有经济学家发现全世界每一栋摩天大楼建起来,就标志着经济衰退。从1908年开始,建了大都会,金融危机来了;1920年代,帝国大厦建了,经济箫条来了;1970年代世贸中心,经济箫条又来了。还有更多的指数,比如口红指数、超短裙指数。
指数一旦发布对社会有反作用力,它不仅仅帮助大众、专家去认识一个社会现象,看清未来的变化,同时会影响社会。克强指数发布了,有更多的人会盯住用电量,想做大政绩的政治家、行政长官,想从用电量上做文章。 为什么从一个简单的数据就能认识到纷繁复杂的现象,这就是数据的力量。数据是指数的土壤,数据是对客观世界的测量和记录,是来自于真实世界的证据,它表示的是过去,但是它表达的是未来,所以我们能从指数当中获得对现象的认识,核心是因为数据有外部性。我们的世界普遍联系,一种数据收集的时候是为这个目的,但是在用的时候它可能用在一个新的维度,产生新的作用,我把这称之为数据外部性。 我们要做好第一类简单的指数,要善于发现相关性和数据的外部性。 第二类指数是极其复杂的指数。 比如发改委发布的居民消费价格指数,有很多算法、加权、模型在里面。 前几年我在《南方都市报》写过一篇文章,当时发改委发布了中华民族复兴指数,说我们的复兴指数是62.74%。这个指数发布出来之后受到了大众的嘲笑,有人说民族复兴这件事能准确到62.74%吗?这件事情是不可度量的。
发改委向大众解释了它的模型,三级指数下面有六个指标,每个指标下面又有30个指标,每个指标有不同的加权。即使这样,我们有专家还在挑战这个指数。 《南方都市报》发表了一篇秋风先生的文章,他批评说量化民族复兴是迷信理智、迷信数据,这件事情是根本没有办法量化的。 我在美国看到这份报纸之后,当天晚上就写了一篇文章反驳秋风先生的观点,我认为如果民族复兴是一件我们要去做的事情,我们就应该让它变得可以量化。因为当这件事情不可以被测量的时候,它就是不可以被管理的。无测量不管理,这就是我们今天为什么要做指数。 大家的批评一方面是来自于对指数、对量化的无知,另外一方面,他们认为夸大了了,民族复兴没有道理是62.74%。但在这个过程中没有人去质疑它的算法和模型。 (责任编辑:本港台直播) |