爬虫导出图片

reg htm index get list eve gre src html

#coding=utf-8
import urllib
import re

def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
return html

def getImg(html):
reg = r‘src="(https:.+?[\.jpg,\.jpeg])"‘
imgre = re.compile(reg)
imglist = re.findall(imgre,html)
print type(imglist)
print len(imglist)
x = 0
#下载并修改文件名
for imgurl in imglist:
urllib.urlretrieve(imgurl,‘%s.jpg‘ % x)
x+=1

html = getHtml("https://tieba.baidu.com/index.html")

getImg(html)

爬虫导出图片

来源: http://www.bubuko.com/infodetail-2376346.html

与本文相关文章

Python 爬虫入门教程 8-100 蜂鸟网图片爬取之三
自己动手编写一个网络图片爬虫
Python 中 Scrapy 爬虫图片处理详解
python 爬虫获取图片
JS如何导出Div的内容为图片
python 爬虫入门 ---- 案例爬取上海租房图片
Python 爬虫入门教程: 知乎文章图片爬取器
【.net 深呼吸】导出 Office 文档中的图片

暂无,快来抢沙发吧！