Question

我写了scrapy脚本，差不多完成了。我有一个问题。结果不按正确的顺序收集。请看我的问题，这是代码：

import scrapy


class BrickSetSpider(scrapy.Spider):
name = "molo_spider"
start_urls = ['https://example.com']

def parse(self, response):

    for result in response.xpath('//body'):
         yield {
             'test1': result.xpath('//div[@class="eoDetailNewBrand"]/span[1]/text()').extract_first(),
             'test2': result.xpath('//div[@class="eoDetailNewBrand"]/span[2]/text()').extract_first(),
             'test3': result.xpath('//span[@itemprop="price"][1]/@content').extract_first(),
             'test4': result.xpath('//tr[@class="erDetailItem erFontSizeS"][2]/td/span[1]/text()').extract_first(),
             'test5': result.xpath('//tr[@class="ekDetailItem ekFontSizeS"][2]/td/span[3]/text()').extract_first(),
             'test6': result.xpath('//tr[@class="elDetailItem elFontSizeS"][2]/td/span[5]/text()').extract_first(),
             }

我的结果（csv文件）完美但顺序错误：

... TEST2 TEST3 ... TEST5 ... TEST6 ... 测试1 ... TEST4 ...

我需要：测试1 ... 测试2 ... TEST3 .. 等

这是怎么做到的？

Answer 1

在settings.py中只需添加

FEED_EXPORT_FIELDS = ['text1'，text2'，'text3']

Scrapy。导致错误的序列

1 个答案: