通过图表的比较,我们很容易就能找出这四组数据的区别了。I组数据呈现整体离散向上的趋势。II组数据呈现弧度上升,然后再下降的趋势。III组数据呈现线性上涨的趋势,但有一个点突出。IV组数据呈现Y坐标不变X上升的趋势,但有一点突出。 将数据图形化后,大脑天然的会对图形的不同点做出反应,从而更高效的理解数据带来的意义。 我们再来看下其他例子: 将当前QQ的在线人数,通过可视化的方式展示给用户。把数据置于视觉控件中,这样用户就能很直观的了解到QQ当前使用的人群分布在中国是怎么样的,那里的人群分布多,那里的人群少。 Eric Fischer 针对Twitter 发短消息的位置和Flickr 拍照片的位置为数据源做的名为“看图或说话”(SeeSomething or Say Something)的大数据可视化展示,通过简单但大量的数据,做出非常美的数据图展示。 这种用图形化对数据进行描述设计的过程,我们通常称为【数据可视化】。有时候,可视化的结果可能只是一个条形图表,但大多数的时候可视化的过程会很复杂的,因为数据本身可能会很复杂的。一般流程包括【数据收集】-【数据分析&清理】-【可视化设计】,从抽象的原始数据到可视化图像。 要做出好的【数据可视化】,拆分出来核心要先了解什么是【数据】。 数据 数据是可视化的基础,它不仅仅是数字,要想把数据可视化,就必须知道它表达的是什么。根据Ben Shneiderman的分类,信息可视化的数据分为以下几类: 一维数据:X轴一个维度如果1、2、3、4 ··· 二维数据:X,Y两个二维度(1、2),(3、4),(5、6),(7、8)··· 三维数据:X,Y,Z三个维度(1、2、3),(4、5、6),(7、8、9) ··· 多维数据:X,Y,Z,···多个维度(1、2、3、4、···),(5、6、7、8、···) 时态数据:具有数据属性的数据集合。 层次数据:具有等级或层次关系数据集合。 数据种类划分是十分多的,但是这些数据都描述了现实的世界中的一部分,是现实世界的一个快照。除了类型,数据的数量级也影响这数据的表达结果。 小数据量(小于100)展示一下静态结果,中数据量(1K~100K)呈现数据反映的事实,大数据量(大于1M+)用于研究分析,推测结果。 我们来看一个数据:【2017年1月28号,成都PM2.5值245】,从这个数据里能看出什么,可能只是会觉得当天成都空气质量不好,我们可能会联想到这个样一个画面。 好像就不能得出什么了。其实从单个小数据上来看,我们很难得到什么有价值的信息。 只能匹配出数据代表的当前的静态状态结果。所以要想发挥出数据可视化的作用,首先我们需要大量真实的数据,知道数据的来龙去脉,把它作为一个整体来理解,关注全貌对原始数据了解得越多,打造的基础就越坚实,也就越可能制作出令人信服的数据图表。 OK,我们继续丰富我们的原始数据,在中国环境监测总站()的网站获取到成都2017年整个1月份的PM2.5的数据。 中国环境监测总站作为空气质量公开的数据来源,它提供了获取数据的API接口。通过API接口我们可以获取到原始数据。 原始数据一般包含的信息都比较多,什么PM2.5,、空气质量指数、PM10、一氧化碳、二氧化碳、臭氧、二氧化硫等等。我们只需要PM2.5的,所以清理数据,把其他不必要的内容去掉。然后导入到Excel表中,可以得到我们最终需要的数据。 有了【数据】下一步就可以开始做数据的【可视化】。 可视化 通俗地说,可视化设计的目的是“让数据说话”,用图形去讲述数据的故事。可视化是一种表达数据的方式,是现实世界的抽象表达。它像文字一样,为我们讲述各种各样的故事。作为一种媒介,可视化已经发展成为一种很好的故事讲述方式。 我们把成都PM2.5的数据,按照日期和当天的PM2.5指数做出最简单图形来,我们可以得到下面这类的图表来。 这类的图用Excel很简单就能得到。我们可去修改下柱状图的配色,但它依然只是一个简单的图表,而不是好的可视化作品。 那什么是好的可视化作品呢? (责任编辑:本港台直播) |