Scrapy。导致错误的序列

时间:2018-05-23 16:44:56

标签: python web-scraping scrapy scrapy-spider

我写了scrapy脚本,差不多完成了。我有一个问题。结果不按正确的顺序收集。请看我的问题,这是代码:

import scrapy


class BrickSetSpider(scrapy.Spider):
name = "molo_spider"
start_urls = ['https://example.com']

def parse(self, response):

    for result in response.xpath('//body'):
         yield {
             'test1': result.xpath('//div[@class="eoDetailNewBrand"]/span[1]/text()').extract_first(),
             'test2': result.xpath('//div[@class="eoDetailNewBrand"]/span[2]/text()').extract_first(),
             'test3': result.xpath('//span[@itemprop="price"][1]/@content').extract_first(),
             'test4': result.xpath('//tr[@class="erDetailItem erFontSizeS"][2]/td/span[1]/text()').extract_first(),
             'test5': result.xpath('//tr[@class="ekDetailItem ekFontSizeS"][2]/td/span[3]/text()').extract_first(),
             'test6': result.xpath('//tr[@class="elDetailItem elFontSizeS"][2]/td/span[5]/text()').extract_first(),
             }

我的结果(csv文件)完美但顺序错误:

... TEST2 TEST3 ... TEST5 ... TEST6 ... 测试1 ... TEST4 ...

我需要: 测试1 ... 测试2 ... TEST3 .. 等

这是怎么做到的?

1 个答案:

答案 0 :(得分:0)

在settings.py中只需添加

FEED_EXPORT_FIELDS = ['text1',text2','text3']