我写了scrapy脚本,差不多完成了。我有一个问题。结果不按正确的顺序收集。请看我的问题,这是代码:
import scrapy
class BrickSetSpider(scrapy.Spider):
name = "molo_spider"
start_urls = ['https://example.com']
def parse(self, response):
for result in response.xpath('//body'):
yield {
'test1': result.xpath('//div[@class="eoDetailNewBrand"]/span[1]/text()').extract_first(),
'test2': result.xpath('//div[@class="eoDetailNewBrand"]/span[2]/text()').extract_first(),
'test3': result.xpath('//span[@itemprop="price"][1]/@content').extract_first(),
'test4': result.xpath('//tr[@class="erDetailItem erFontSizeS"][2]/td/span[1]/text()').extract_first(),
'test5': result.xpath('//tr[@class="ekDetailItem ekFontSizeS"][2]/td/span[3]/text()').extract_first(),
'test6': result.xpath('//tr[@class="elDetailItem elFontSizeS"][2]/td/span[5]/text()').extract_first(),
}
我的结果(csv文件)完美但顺序错误:
... TEST2 TEST3 ... TEST5 ... TEST6 ... 测试1 ... TEST4 ...
我需要: 测试1 ... 测试2 ... TEST3 .. 等
这是怎么做到的?
答案 0 :(得分:0)
在settings.py中只需添加
FEED_EXPORT_FIELDS = ['text1',text2','text3']