参考网址:
- import requests
- url = 'http://www.baidu.com'
- resp = requests.get(url)
- print(resp.cookies)
- print('============================================================')
- for k,v in resp.cookies.items():
- print(k,'=',v)
执行结果:
- <RequestsCookieJar[<Cookie BDORZ=27315 for .baidu.com/>
- ]> ============================================================ BDORZ
- = 27315 ===================================================================================================================
使用 python 的 requests 开发爬虫程序的时候, 经常需要将之前请求返回的 cookie 值作为下一个请求的 cookie 进行调用,
比如模拟登录之后的返回的 sessionID, 就是需要作为后续请求的 cookie 参数
分成三步走:
1, 通过 requests 模块导入 from requests.cookies import RequestsCookieJar
2, 进行实例化: jar = RequestsCookieJar()
3, 进行设置: jar.set(cookie['name'], cookie['value'])
完成之后就可以在直接在请求网页源文件的时候, 将这个 cookie 带上一起发送请求了
- import requests
- from requests.cookies import RequestsCookieJar
- url = 'http://www.baidu.com'
- resp = requests.get(url)
- print(resp.cookies)
- print('============================================================')
- for k,v in resp.cookies.items():
- print(k,'=',v)
- print('============================================================')
- jar = RequestsCookieJar()
- jar.set('BDORZ', '27315')
- r = requests.get(url,cookies=jar)
- print(r.status_code)
执行结果:
- <RequestsCookieJar[<Cookie BDORZ=27315 for .baidu.com/>
- ]> ============================================================ BDORZ
- = 27315 ============================================================ 200
- ===========================================================================================
来源: http://www.bubuko.com/infodetail-3433906.html