文章起始, 先跟大家说声抱歉. 因为距离我上一篇帖子 turtle 更新已经将近过去了一个月, 相信粉丝们已经等不及了, 还有很多氢粉在后台跟我留言说 "在很早之前就想接触 wordcloud 这个库, 但是万事开头难, 难就难在连库都安装不上", 所以小编今天在正式介绍 wordcloud 之前, 先教大家怎么安装它.
一, word cloud 库的安装
小编电脑的安装环境是 anaconda(版本 4.4.10), 其中库也是在 spyder 下的 ipython 中安装的, 安装方法呢, 一共有两种, 下面小编就为大家逐一介绍下.
1.1 启动命令行, 输入: pip install wordcloud 即可
但是在首次安装时, 无论是 python 还是 ipython 都会报错, 报错的原因呢, 不尽相同, 有的是因为 pip 版本的问题有的是由于别的依赖换句话就是文件缺失. 说了这么多, 给大家上张图吧.
1.1
如果是出现上面的原因, 就按照上面的提示照做就行了. 链接如下:
Visual Studio Build Tools 2017 workload and component IDs - Visual Studio | Microsoft Docs https://docs.microsoft.com/en-us/visualstudio/install/workload-component-id-vs-build-tools
(值得提醒的就是大家一定要下载与之对应的版本)
1.2 到 python 社区中下载安装包进行安装
这种方法呢, 可以说是通解, 即对所有的第三方库安装都适用. 地址如下:
Python Extension Packages for Windows - Christoph Gohlke https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud
下载 wordcloud 安装包然后解压 (需要注意的是一定要下载与之对应的版本).
1.2
查看自己 python 版本的方法为在命令行下输入: python (就可以看到对应的版本号了)
下载完毕后, 我们需要找到下载文件的地址, 然后在此处打开命令行, 输入:
pip install wordcloud-1.41......(也就是你所下载文件的文件名)
1.3 检查 wordcloud 安装是否成功
我们可以在命令行窗口输入: pip list (查看你所安装的所有的第三方库是否存在 word cloud)
也可以在 idle 中直接调用 import wordcloud 检验是否会报错.
二, word cloud 库介绍
wordcloud 库, 可以说是 python 非常优秀的词云展示第三方库. 词云以词语为基本单位更加直观和艺术的展示文本, 下面给大家看一个示例:
2.1
接下来, 介绍下 wordcloud 的基本使用. wordcloud 把词云当作一个对象, 它可以将文本中词语出现的频率作为一个参数绘制词云, 而词云的大小, 颜色, 形状等都是可以设定的.
2.2
在 wordcloud 作为对象时, 大家要注意字母的大小写.
总的来说, 生成一个漂亮的词云文件三步就可以完成. 即: 1, 配置对象参数 2, 加载词云文本 3, 输出词云文件 (如果不加说明默认的图片大小为 400 * 200)
wordcloud 的常规方法如下:
2.3
2.4
运行结果如下:
2.5
wordcloud 做词频统计分为以下几个步骤:
1 , 分隔: 以空格分隔单词 2, 统计 : 单词出现的次数并过滤 3, 字体: 根据统计搭配相应的字号 4 , 布局
常用的参数列表如下:
2.6
学了这么多, 接下来, 让我们做一个 wordcloud 的示例吧! 小编做的是一个小王子某章的词云统计, 有兴趣的同学可以尝试着自己敲下代码, 代码也不算是多.
2.7
运行结果如下:
2.8
下次呢, 小编将会为大家介绍 open.cv 的强大功能, 或者有时间的话就更新一篇关于 python 整个计算生态的文章.
来源: http://www.jianshu.com/p/daa54db9045d