Python 和 web 初学 : 屏幕抓取, CGI 和 mod_python
描述:
1, 屏幕抓取: 通过程序下载网页并提取其中的信息的过程.
方法:
1, 使用正则表达式
2, 结合程序 Tidy(一个 Python 库) 和 Xhtml 解析
3, 使用 Beautiful Soup 库
来源: http://www.bubuko.com/infodetail-3160448.html