pipelines.py

class DemoPipeline(object):

# 开启爬虫时执行,只执行一次
def open_spider(self, spider):
# 为spider对象动态添加属性,可以在spider模块中获取该属性值
# spider.hello = "world"
# 可以开启数据库等
pass

# 处理提取的数据(保存数据)
def process_item(self, item, spider):
pass

# 关闭爬虫时执行,只执行一次。
# 如果爬虫中间发生异常导致崩溃,close_spider可能也不会执行
def close_spider(self, spider):
# 可以关闭数据库等
pass