No70:Scrapy在下载中间件中对URL进行修改
- 问题描述:
用scrapy进行爬虫项目时,已进入URL队列的URL失效,需要进行替换。
- 解决方法
Scrapy可以在下载中间件中对URL进行修改。
request.url是传递到中间件的url,是只读属性,无法直接修改。
可以调用_set_url方法,为request对象赋予新的URL。
def process_request(self, request, spider): |
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 新码农!
评论