有人说, 数据可视化不就是画图嘛, 看不出来研究的价值在哪. 我原来也天真的以为, 数据可视化就是把数据从冰冷的数字转换成图形, 顶多就是色彩丰富一些, 看起来更酷炫, 逼格满满.
其实不然, 一个好的可视化, 能够带给人们不仅仅是视觉上的冲击, 还能够揭示蕴含在数据中的规律和道理.
可视化的意义
可视化的终极目标是洞悉蕴含在数据中的现象和规律, 这里面有多重含义: 发现, 决策, 解释, 分析, 探索和学习.
简明定义是: 通过可视表达增强人们完成某些任务的效率. 比如, 相同统计特征 (方差, 均值等) 的几组数据可视化出来的结果是完全不同的. 如下面的图 1 所示:
可以化的意义在于, 可视化作为人脑的辅助工具, 可以替我们保留一部分信息, 好记性不如烂笔头. 其次, 图形化的符号可以将用户的注意力引导到重要的目标.
可视化的目标和作用
传统的可视化可以大致分为探索性可视化和解释性可视化, 按照应用来分, 可视化有多个目标:
有效呈现重要特征
揭示客观规律
辅助理解事物概念和过程
对模拟和测量进行质量监控
提高科研开发效率
促进沟通交流和合作
按照宏观的角度看, 可视化的三个功能:
信息记录
信息推理和分析
信息传播与协同
数据可视化分类
数据可视化包含三个分支, 科学可视化 (Sci Vis, Scientific Visualization ) 和信息可视化 (Info Vis, Information Visualization), 以及后来演化出第三个分支: 可视分析(VAST, Visual Analytics Science and Technology) 这个从 IEEE VIS 会议的分类中可以看出来.
科学可视化面向的是科学和工程领域数据, 比如空间坐标和几何信息的三维空间测量数据, 计算机仿真数据, 医学影像数据, 重点探索如何以几何, 拓扑和形状特征来呈现数据中蕴含的规律.
信息可视化的处理对象是非结构化, 非几何的抽象数据, 如金融交易, 社交网络和文本数据, 其核心挑战是针对大尺度高维复杂数据如何减少视觉混淆对信息的干扰.
近几年来, 随着人工智能的兴起, 人们逐渐发现其实一些机器能比人做得更好的事情, 同时也发现了一些事情需要借助人类 3 亿年的进化本领. 所以将可视化与分析进行结合, 产生了一个新的学科: 可视分析学.
可视分析学被定义为由可视交互界面为基础的分析推理科学, 将图形学, 数据挖掘, 人机交互等技术融合在一起, 形成人脑智能和机器智能优势互补和相互提升.
数据可视分析和数据挖掘的异同
数据可视分析和数据挖掘的目标都是从数据中获取信息与知识, 但是手段不同.
数据可视分析是将数据呈现给用户以易于感知的图形符号, 让用户交互地理解数据.
数据挖掘是通过计算机自动或者半自动地获取数据隐藏的知识, 并将获取的知识直接给予用户.
也就是说, 数据可视化可以看到交互界面, 更适合于探索性地分析数据. 而数据挖掘面对的是一堆活生生但黑不溜秋的数据, 需要像挖煤一样从中发现金子.
参考文献:
[1] 陈为, 张嵩, 鲁爱东. 数据可视化的基本原理与方法[M]. 科学出版社, 2013.
[2] http://echarts.baidu.com/examples/editor.html?c=scatter-anscombe-quartet
来源: https://juejin.im/post/5b192812e51d4506af2e92d8