No68:Scrapy修改User-Agent
1、默认请求头
USER_AGENT = "Scrapy/1.8.0 (+http://scrapy.org)" |
2、修改请求头
- 全局设置
所有爬虫的所有连接生效。
settings.py
USER_AGENT = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.0.0 Safari/537.36" |
- 爬虫设置
单个爬虫所有连接生效。
spider.py
class MySpider(scrapy.Spider): |
- 链接设置
单个请求的单个链接生效。
spider.py
USER_AGENT = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.0.0 Safari/537.36" |
- 中间件设置
从整个项目中去修改请求头的设置规则,变化多端,不同的写法,可以配置出不同的设置方式。
settings.py
"DOWNLOADER_MIDDLEWARES": { |
middlewares.py
class UserAgentMiddleware(object): |
3、优先级
中间件headers > 爬虫的custom_settings > 项目的settings.py > Scrapy默认 |
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 新码农!
评论