使用正则表达式Scrapy排除多个条件

时间:2017-05-10 18:31:44

标签: python python-2.7 web-scraping scrapy

我是Scrapy的新手

我想在同一项目中排除两个元素。下面我不包括“SKU:”,我想添加“ sku ”。我找不到路。

'SKU': ready.xpath(SKU).re_first(r'SKU:\s*(.*)'), # Limpia SKU:

Anny的建议?非常感谢

1 个答案:

答案 0 :(得分:1)

不确定你想要什么,但看起来你在谈论可以针对“SKU”和“sku”运行的正则表达式。在extract_first中,您可以使用python编译的正则表达式而不是字符串,因此可以这样做:

import re

re_sku = re.compile(r'sku:*\s*(.+)', re.IGNORECASE)

...
'SKU': ready.xpath(SKU).re_first(re_sku),