python 携带cookie获取页面内容-白红宇

python 携带cookie获取页面内容

阅读量：6870 次

发布时间：2019-06-26

本文共 1085 字，大约阅读时间需要 3 分钟。

有时会遇到爬取的页面需要登录，这就要带上cookie了。

下面记录了几种携带cookie的方法

# coding=utf-8import requestss = requests.Session()login_data = {'username': 'teacher', 'password': 'teacher'}# 方法1# resp1 = s.post('http://192.168.2.132/login/', data=login_data)# r = s.get('http://192.168.2.132/personal_live/')# 方法2# resp1 = requests.post('http://192.168.2.132/login/', data=login_data)# print('cookie:' + str(resp1.cookies))# r = requests.get('http://192.168.2.132/personal_live/', cookies=resp1.cookies)# 方法3# c = {'sessionid': '3ps7ouyox1l43alcb7rafxg9dtfnurcb'}# r = requests.get('http://192.168.2.132/personal_live/', cookies=c)c = {    '.CNBlogsCookie': 'D020D...07',    '.Cnblogs.AspNetCore.Cookies': 'CfDJ...WA',    'SyntaxHighlighter': 'java',    'SERVERID': '560...34'}r = requests.get('https://i.cnblogs.com/EditPosts.aspx?opt=1', cookies=c)resp = r.textprint(resp)

方法1是利用同一个Session，先登录，再访问有限制页面。

方法2是直接使用requests，和1一样，同样是先登录，获取cookie,携带cookie访问限制页面。

方法3是手动从浏览器获取cookie，再携带cookie访问限制页面。

优缺点：

1,2差不多，都是直接运行脚本就可以了，但是需要登录页面没有验证码一类的处理。

3可以应对各种网站，但是需要手动获取cookie。

转载于:https://www.cnblogs.com/lanqie/p/8392696.html

你可能感兴趣的文章

《云数据管理：挑战与机遇》一第1章

查看>>

《嵌入式C编程实战》——1.5　软件开发工具

查看>>