BeautifulSoup 三大特点:
BeautifulSoup 提供了一些简单的方法和 Pythonic 成语, 用于浏览, 搜索和修改解析树: 一个解剖文档并提取所需内容的工具包. 编写应用程序并不需要太多代码
BeautifulSoup 自动将传入文档转换为 Unicode 和传出文档为 UTF-8. 您不必考虑编码, 除非文档未指定编码, 而美丽汤不能检测到编码. 然后您只需指定原始编码.
Beautiful Soup 位于流行的 Python 解析器 (如 http://lxml.de/ 和 html5lib) 之上 http://code.google.com/p/html5lib/ , 允许您尝试不同的解析策略或交易速度以获得灵活性
下载链接: https://share.weiyun.com/5f6ZawU (密码: fODC)
安装 BeautifulSoup:
分以下几步:
1. 解压 BeautifulSoup 的安装包到 python 的安装目录, 如下图
2. 在 cmd 中 cd 到 BeautifulSoup 的安装目录输入 python setup.py install 回车会出现如下图的加载:
这个时候就证明安装成功了, 还有最后一步.
3. 进入 python->Lib->site-packages 将 bs4 文件夹复制到 Lib 文件夹下
将 python 安装目录下的 Tools->scripts->2to3.py 文件复制到 Lib 下, 这一步同上
最后在 cmd 中 cd 到 lib 目录, 然后写入 python 2to3.py bs4 -w 如下图即可:
在 eclipse 上就可以正常的导入 BeautifulSoup 库了
来源: https://www.cnblogs.com/liuduanwu/p/9226928.html