python爬虫如何避免重定向

在Python爬虫中阻止重定向可以通过以下几种方法实现：

1. 使用`requests`库的`allow_redirects`参数：

 import requests session = requests.Session（） response = session.get（url, allow_redirects=False） 设置为False来禁止重定向

2. 使用`urllib.request`模块，并继承`HTTPRedirectHandler`类重写`http_error_302`方法：

 from urllib import request class NoRedirHandler（request.HTTPRedirectHandler）: def http_error_302（self, req, fp, code, msg, headers）: return fp 返回原始文件指针，不跟随重定向 opener = request.build_opener（NoRedirHandler（）） response = opener.open（url） 使用自定义的opener打开URL

3. 使用`scrapy`框架，在`settings.py`中设置`REDIRECT_ENABLED`为`False`：

 settings.py REDIRECT_ENABLED = False

4. 使用`scrapy`框架，在`settings.py`中添加自定义下载中间件来禁止重定向：

 settings.py DOWNLOADER_MIDDLEWARES = { 'myproject.middlewares.NoRedirectMiddleware': 100, }

然后在中间件文件`middlewares.py`中实现禁止重定向的逻辑：

 middlewares.py class NoRedirectMiddleware（object）: def process_response（self, request, response, spider）: if response.status in （301, 302）: return None 返回None来阻止重定向 return response

选择适合您使用框架的方法来阻止重定向

正文

python爬虫如何避免重定向

相关阅读

python的列表如何使用

python中怎么求阶乘的和

python输出字符如何换行

如何从命令行启动python

如何选择python解释器

python字符串怎么清除空格

python中槽是什么

python使用什么表示转义字符

python如何安装在d盘

python列表怎么输中文