我正在运行四个蜘蛛并将数据导出到一个csv文件中。但是,当第二个蜘蛛运行并获取数据时,它将创建具有列名称的同一行。我试图用FEED_EXPORT_FIELDS格式化行标题,但这没用。
我想要做的是拥有1行标题,并为每个蜘蛛填充它下面的所有数据。该图像显示了错误,下面给出了一个示例,说明了我要完成的工作。
我确实看过CsvItemExporter,但不清楚如何从所有四个蜘蛛获取数据并导出数据。我已经阅读了文档,但仍然看不到如何将所有这些结合在一起。
TMP_FILE = os.path.join(os.path.dirname(sys.modules['products'].__file__), 'tmp/allproducts.csv')
FIELDS = ['url', 'company', 'location', 'price', 'make', 'model', 'year', 'height']
process = CrawlerProcess({
'FEED_FORMAT': 'csv',
'FEED_URI': TMP_FILE,
'FEED_EXPORT_FIELDS': FIELDS,
})
process.crawl(Spider1)
process.crawl(Spider2)
process.start()
答案 0 :(得分:0)
您有几种选择: