数据可视化一直是我非常感兴趣的课题, 虽然已经完全忘记是什么时候开始被她吸引; 数据的魅力在于它真实地记录了我们, 我们的好或是不好在这里都只是数字的累积. 真实的数据也是混乱的, 因为我们本身, 真实本身, 就是混乱的.
将混乱的现实变得清晰简单, 这便是可视化.
为什么要做数据可视化
"数据太枯燥了, 我根本不想看","这么复杂, 根本看不懂", 这是需要让数据变得可视化的第一个理由. 由于人类本身有限的认知能力, 我们的大脑天生无法处理一堆单纯的数字. 我们需要让数字变为我们能够理解, 并更加敏感的信息 -- 图形.
将缓慢的推理演算过程, 变为能够被直观感受的物体; 理解这一点, 你便掌握了可视化设计的全部, 只要稍加练习, 你就可以成为伟大的数据分析师.
如何将数据可视化
可视化的基本元素
早在 1967 年, 法国制图师 Jacques Bertin 就总结归纳了人对图形符号的认知能力和特征, 这一研究成果也受到广泛的认可. 在《图形符号学》这本书中, Jacques 不仅发现了我们对于不同视觉变量的敏感程度, 更是对不同符号能够承载的信息种类做了详尽的说明. 这一分析理论也成为了大部分数据可视化的基础原理.
如图所示, 我们对图形的感知分为: 位置, 大小, 形状, 灰度, 色相, 角度, 纹理这七种维度. 每一种视觉变量都有其适用于的数据类型, 并且在可读性上也有不同. 简单举例, 色相的不同能够表示不同的变量, 但当色相种类超过 20 个时, 便已无法快速辨认; 色相能够很好的表示分类, 但不能表达序列关系.
数据可视化的基础便是合理的运用视觉变量, 来展示不同类型的信息; 无论是简单的 BarChart, 还是名字美丽的 Nightingale Rose Chart, 都可以按照这个理论来分析其设计原理与合理性. 当我们在设计新的可视化方案时, 也需要灵活的运用这些元素.
有趣的图表
在工作中, 我们往往是通过使用现有的图表去构建一个 Dashboard, 来完成对数据的简单可视化; 那么, 了解现有图表的种类和适用场景便是第一步.
图表的种类已有非常多, 无法在这里面面俱到, 有兴趣的盆友可以访问一些可视化工具网站, 上面都会有详细的说明和整理; 我在这里推荐几个我所了解的.
●AntV 图表用法手册, 可视化工具; 其中对应整理了相对完整的基础图表介绍和使用场景;
●Tableau 可视化库, 非常有名且好用的数据分析工具; 官网提供很多真实数据可视化案例, 不再是单一图表, 而是结合了各种图表来讲述事实; 你可以直接在图表上交互, dig data;
●Gapminder, 由瑞典著名的数据分析教授 Hans Rosling 创建的可视化工具, 雏形是他在 TED Talk 演讲时的研究工具; 汉斯老爷爷在 2017 年离开了世界, 但他用数据可视化极其震撼地向我们展现了人类在追求幸福事业上的足迹, 用一个可以播放的可视化图表, 非常直观生动地展示了时间的变化;
令你的观众兴奋
如何将混乱的现实变得清晰简单, 这是我们在做可视化的时候需要注意的; 但是更重要的是, 我们需要明确可视化的目的. 其实, 可视化只是数据分析 workflow 中的一个部分; 当我们需要使用可视化工具时, 一定是先有一个数据分析展示的需求. 那么, 我们希望通过可视化告诉 "观众" 什么就变得非常重要.
甚至有时候, 为了论证某一观点, 可视化能够欺骗观众.
避免糟糕的错觉
这是我在许多数据可视化大会中, 发现经常被分享者拿出来吐槽的一点; 什么才是好的可视化, 如何合理的运用视觉变量展示你的信息?
第一个反面教材便是大家特别喜欢的 Piechart. 很多时候, Piechart 并不能很高效的展示信息. 原因是, 饼图往往会把人的视觉聚焦在中心的角度变化上, 但是人们对角度的感知能力是比较差的. 如下图所示, 你很难分辨出三个饼图中最大的色块分别是哪个.
但是, 当我们把它变换成 barchart 的时候, 就变得非常清楚; 这是因为视觉对位置的信息是极其敏感的. 我们在看 barchart 的时候, 视觉会自然地去对比端点的位置, 我们甚至不需要去思考更多.
第二个例子, 比 Piechart 更加糟糕的, 是 3D Piechart. 如下图所示, 这是在 Apple 的发布会上的一页 Slide; 你会发现, 图上 19.5% 的部分居然看起来要比 21.2% 要大; 网上也有很多关于 Apple 的历年演讲中出现的误导观众的图表分析, 有兴趣的话可以搜索一下.
所以第二个需要注意的点在于, 我们需要谨慎地使用 3D, 人们对于 3D 信息的感知并不敏感, 而且这会加重观众的认知负担.
第三点, 请确保 Barchart 的纵坐标起点为原点. 如下图所示, 左侧的图表中两者的差值似乎已成倍数关系, 但当我们将起点恢复到零时, 其实差别非常小. 这个误导的原因在于, 我们是在通过 Barchart 来对比两者之间的差别, 而左侧的图错误的放大了这个差别. 所以, 在做可视化之前, 必须先要清楚我们想要表达的内容是什么.
讲述你的故事
究其根本, 图表其实就是在比大小; 即便它能展现得再清楚, 你也不可能在之后更久记住他们的关系和数字; 而真正留下的, 是讲述者的观点, 是你对客观事物的映像, 亦是你对当下决策的判断.
米纳德是以图呈现工程与统计资讯的先驱, 其最知名的作品《1812-1813 对俄战争中法军人力持续损失示意图》, 该图描绘了拿破仑的军队自离开波兰 - 俄罗斯边界后军力损失的状况, 图中透过两个维度呈现了六种资料: 拿破仑军的人数, 距离, 温度, 经纬度, 移动方向, 以及时 - 地关系. 军队人数由带宽表示, 一毫米代表一万人; 米黄色代表军队前往俄国时的过程, 黑色则代表自俄国撤退的过程.
这张图充分的展示了滑铁卢这一历史事件. 可能曾今你对这场战争毫无概念, 但仅仅几秒钟, 你便可从图上感受到它的悲壮. 你不需要去知道任何的一个数字, 图形本身已经向你传达了它的内容.
因此, 令人兴奋的可视化不仅需要清晰的展现出数据, 还要表达出你想要 "观众" 关注的内容; 这可能是一个潜在的问题, 可能是造成某种现象的原因, 也可能是血淋淋的事实结果; 真正震撼人心的, 是你通过可视化所讲述的故事.
结尾 - 汉斯. 罗斯林
说到这儿, 我就快讲完了. 当然可视化中还有许多的细节, 我还不胜了解, 也希望能够继续探索; 最后, 希望在这里分享一位人欢喜的数据分析者, 汉斯. 罗斯林. 汉斯. 罗斯林 (Hans Rosling) 最出名的一次演讲, 是他在 4 分钟内, 用 12 万个数据解释 200 个国家 200 年的发展. 他试图证明, 人类社会是否正朝着更健康更富有的方向发展. 他用真实的数据让观众理解一个个宏观命题的答案, 他用可视化的方式生动的告诉你 "世界其实是这样的".
"当汉斯讲话的时候, 我能看到人们脸上那种'Aha 瞬间', 他可以以一种轻松的方式打破神秘." 比尔. 盖茨的妻子, 同时也是盖茨基金会的联合创始人梅琳达. 盖茨说.
| [UI 分享] 设计 Seed 与游戏交互设计
| [UI 分享] 游戏与游戏化
大侠, 长按二维码保留联络点
来源: http://www.tuicool.com/articles/2i2Ez2A