编译 | 丁雪,姚佳灵 随着数据大环境(data climate)越来越快地发展,数据可视化的趋势永远在转变和变化。在过去五年、当下或更远的未来,我们处于什么位置?一些重要的事情正在发生…… 数据的意义 让我们从如何思考及如何处理数据开始,下面的数据演化流已经清楚地展示了这个流程: 简单地说,从原始数据开始。原始数据是指被感应器、人类或其它任何方式记录下来的数据,它们以其原始的形式(数字、符号或文字)存储下来。第二步,将数据以表、列和电子表格的形式组织起来,那样我们能够开始理解数据。这个步骤一旦开始后,我们可通过提供上下文细节,将处理过的数据转化为信息位,以解释某些数据点的意义,以及它们之间是如何关联的。这之后,数据被定型,一旦我能够感知那些信息、理解它,并且和我之前的记忆与经验相联系在一起后,我就获得了知识。这最终给了我智慧,以让我根据来自原始数据点的那些知识做出未来的决策。 我也认为数据演化流和在如今的数据可视化世界中事物如何发展之间存在松散的相关性。 首先我想分享一些利用数据可视化获得洞察的例子,数据是形成理解的基础,也能够让下次决策变得更加明智。 数据的关联性:1986年挑战者号灾难 我非常清楚地记得第一次看到爱德华·塔夫特出版的《视觉的解释》(Visual Explanation)一书中这篇文章的情形,我永远不会忘记。我多次用这个例子是因为它证明了理解数据、选择正确数据点的重要性。 作为事故调查的一部分,那些负责允许飞船发射的人员给出了以下数据作为证据,表明他们无法预测危险。想到这些火箭工程师被认为是地球上最聪明的人,令人感到吃惊的是他们认为用这种格式展示他们的案例已经足够好了。 作为他们统计证据的一部分,工程师们只在25架可发射的火箭中查看了9架,并且限于一个很小的技术因素范围内。但是最重要的问题是似乎没有人将火箭发射失败与发射当天的气温联系起来。 塔夫特重新设计了图表,专注于准确的相关性。 正如你所见,挑战者号发射时的气温大约为27华氏度,这一温度低于最低的发射温度,刚好是会造成(火箭)受损的最高指数。 图中还清楚地显示,气温越高对火箭损害的越小。现在,你可以说这张图看起来完全不像“火箭科学”,它只是证实了发现最具关联性的数据并不总是那样直截了当的。许多人说,塔夫特的案例忽略了涉及到的数据与物理的大部分复杂性,但是在我眼中这仍是一个重要的教训。 美国海洋学家和制图师马修·莫里所从事的一项早期大数据项目是一个很好的例子。他汇聚了数以万计航海日志中的数据而编制了第一部海洋地图集。 它的重要性在于其帮助船只更快、更安全地到达目的地。如果你能更快地到达,意味着你能够在战争或商业上占取先机。 领英的网络可视化图:承认复杂性 在过去五年左右的时间中,我们看到了诸多可视化利用了这个想法。像这张领英的网络可视化图,描述了社交网络令人惊讶的复杂性。 它只对处理后的数据(数据演变图)进行了可视化,但可以说它并没有将数据转化为有意义的信息。 如果你把数据可视化看做设计世界中的新范式,那种展示数据力量的想法是完全有意义的。全都是关于证明你拥有数据、有权访问它、可以理解它或是说你有能力操纵它。 另一个例子是布伦丹·达文斯为EE完成的作品,该作品展示了人们在城市生活的一天中谈论的内容。这些可视化的有趣性在于承认复杂性。他们几乎把这些当作荣誉勋章而戴上。 (责任编辑:本港台直播) |