人生苦短, 我用 Python
前文传送门:
小白学 Python 数据分析(1): 数据分析基础 https://www.geekdigging.com/2020/01/19/6719980708/
小白学 Python 数据分析 (2):Pandas (一) 概述 https://www.geekdigging.com/2020/01/20/6718497214/
小白学 Python 数据分析 (3):Pandas (二) 数据结构 Series https://www.geekdigging.com/2020/02/04/3234667780/
小白学 Python 数据分析 (4):Pandas (三) 数据结构 DataFrame https://www.geekdigging.com/2020/02/05/9920298470/
小白学 Python 数据分析 (5):Pandas (四) 基础操作 (1) 查看数据 https://www.geekdigging.com/2020/02/16/6852411690/
小白学 Python 数据分析 (6):Pandas (五) 基础操作 (2) 数据选择 https://www.geekdigging.com/2020/02/20/6566891797/
小白学 Python 数据分析 (7):Pandas (六) 数据导入 https://www.geekdigging.com/2020/02/23/7355903936/
小白学 Python 数据分析 (8):Pandas (七) 数据预处理 https://www.geekdigging.com/2020/02/25/9013297409/
小白学 Python 数据分析 (9):Pandas (八) 数据预处理(2) https://www.geekdigging.com/2020/02/27/2857868620/
小白学 Python 数据分析 (10):Pandas (九) 数据运算 https://www.geekdigging.com/2020/02/29/5808964196/
小白学 Python 数据分析 (11):Pandas (十) 数据分组 https://www.geekdigging.com/2020/03/03/5975552137/
小白学 Python 数据分析 (12):Pandas (十一) 数据透视表(pivot_table) https://www.geekdigging.com/2020/03/04/8327177610/
小白学 Python 数据分析 (13):Pandas (十二) 数据表拼接 https://www.geekdigging.com/2020/03/06/5036602239/
小白学 Python 数据分析 (14):Pandas (十三) 数据导出 https://www.geekdigging.com/2020/03/07/6918490736/
从本篇开始, 整个系列进入到第二部分, 数据可视化.
那么, 什么是数据可视化?
可以看下下面这个动图, 动图来源阿里云官网( https://data.aliyun.com/visual/datav ).
可以看到, 这个动图非常的炫, 那我们是不是学了数据可视化以后就能做出来这种效果.
emmmmmmmmmmmm........
这个难度有点高, 打怪升级也没有直接出门打 BOSS 的打法撒.
工欲善其事必先利其器
我们先看下现在使用的主流数据可视化的工具 (类库) 有什么.
Matplotlib
第一个当然是我们在前面开篇中介绍过的 Matplotlib , Python 数据分析经典三件套之一.
首先还是几个官方网址罗列一下, 防止有的同学找不到:
GitHub: https://github.com/matplotlib/matplotlib
官网: https://www.matplotlib.org/
中文网: https://www.matplotlib.org.cn/
Matplotlib 的安装过程还是十分简单的:
pip install matplotlib
等待进度条走完, 我们就算安装完成了.
在学习怎么使用 matplotlib 之前, 我们可以先看下 matplotlib 的一些示例:
错了错了, 这么复杂的图我怎么可能画的出来...
下面这种才是我们的目标:
pyecharts
在除了可以使用 Matplotlib 作为数据可视化的工具之余, 我们还可以选择 pyecharts 作为数据可视化工具.
先做一个简单的简介, 以下内容来自官方文档:
Echarts 是一个由百度开源的数据可视化, 凭借着良好的交互性, 精巧的图表设计, 得到了众多开发者的认可. 而 Python 是一门富有表达力的语言, 很适合用于数据处理. 当数据分析遇上数据可视化时, pyecharts 诞生了.
相信很多同学对 Echarts 并不陌生, 在做页面图表的时候, 能选择的第三方支持库并不多, 而 Echarts 是其中做的相当不错的一个类库, 毕竟背后是由百度开源的.
放几个官方的链接:
GitHub: https://github.com/pyecharts/pyecharts
官方文档: https://pyecharts.org/#/
接下来还是看如何安装:
pip install pyecharts
和前面安装 Matplotlib 一样, 静静的等待进度条走完就行.
这里有关版本有一点需要注意, 不管是使用 Matplotlib 还是使用 pyecharts , 都需要 Python 的版本是 3.x , 在官方文档中都已经注明 2.x 不再进行维护.
至于小编为什么要介绍 pyecharts 呢? 给大家看几个官方的示例:
是不是感觉单纯的从 UI 设计的角度上来讲, pyecharts 要比 Matplotlib 要好看的多, 感觉 Matplotlib 像是上个世纪的产物.
在接下来的内容中, 小编会先分享 Matplotlib 的使用, 之后会专门写几篇介绍下 pyecharts 的使用.
数据可视化的基本流程
第一步: 整理数据
数据还是数据可视化的基础, 在所有的事情开始之前, 需要先明确需要把哪些数据图表化.
第二步: 明确目的
在上一步中, 我们拿到了需要图表化的数据, 接着就需要想清楚, 我们展示这些数据到底是为了什么, 是要表达一种趋势, 还是要展现对比等等.
第三步: 选择图表形式
在明确了我们的目的之后, 就需要选择展现这些数据的形式了, 我们需要为这些数据选择合适的展现形式, 这就需要分情况讨论了.
例如我们想要展现一种趋势, 那么折线图就要比柱状图更为合适, 如果是需要展现对比, 那么柱状图就要比折线图合适, 还有是展现百分比, 那么我们选择饼状图就会更为合适.
本篇的内容就到这里了, 下一篇, 我们接着介绍 Matplotlib 的使用姿势.
来源: https://www.cnblogs.com/babycomeon/p/12467064.html