urllib 库: 分析 Robots 协议

from urllib.robotparser import RobotFileParser
import ssl
from urllib.request import urlopen
ssl._create_default_https_context = ssl._create_unverified_context
rp = RobotFileParser()
rp.set_url('http://www.jianshu.com/robots.txt')
rp.read()
print(rp.can_fetch('*', 'http://www.jianshu.com/p/b6755402d7d'))
print(rp.can_fetch('*', 'http://www.jianshu.com/search?q=python&page=1&type=note'))

parse() 读取分析

rp = RobotFileParser()
rp.parse(urlopen('http://www.jianshu.com/robots.txt').read().decode('utf-8').split('\n'))
`

来源: http://www.bubuko.com/infodetail-2911567.html

与本文相关文章

InfiniBand技术和协议架构分析
Web 协议详解与抓包实战: 如何用 Chrome 的 Network 面板分析 HTTP 报文
「得到」竞品分析
对法 3 的分析
画像分析-概述
Asyncdb（三）：MySQL网络协议分析
某宝直播协议分析
网络协议图形化分析工具EtherApe

暂无,快来抢沙发吧！