想将自己所学的东西整理出来有一段时间了, 但由于自身的原因, 今天才着手开始, 那就从最近学的 Python 入手吧, 讲述一个发生在词云上的海龟和爬虫的故事.
一, 项目思路大纲
思路大纲图
二, 项目实现操作
1. 爬虫部分
(1)网络爬虫, 爬取 html 页面
爬取网页内容的函数
(2)对爬取的内容进行解析和处理
对爬取的内容进行解析和处理的函数
(3)对上述函数的调用
函数调用
(4)最终获取的数据
获取的数据部分截图
2. 海龟部分
(1)turtle 库绘制图片代码
turtle 库画图代码 1
turtle 库画图代码 2
turtle 库画图代码 3
(2)turtle 库绘制的图片
turtle 库绘制的图片
3. 将处理后的内容 (CSV 格式的文件) 绘制成图云来展示
(1)将获取的 CSV 格式数据文件绘制成图云的代码
绘制成图云的代码
(2)以图云展示的结果图
图云展示结果
三, 小结
本次主要实现了爬取某个网页的内容, 然后对爬取得内容进行解析和处理, 将获取的数据以 CSV 文件的格式存储, 最后将数据以图云的形式绘制在 turtle 库画的图上.
来源: http://www.jianshu.com/p/29ad6c7f5548