使用Scrapy

时间:2018-07-10 06:18:52

标签: python-3.x scrapy

我该怎么做才能只获得标题为“ Specifications”或“ Product Details”之类的特定表。Url有很多表,我只想抓取具有上述明细的表。链接为: (http://catalog.koffler.com/item/ieee-841-motors/ge-x-d-ultra-841-tefc-extra-severe-duty-motors/M352) 这是我在xpath中的代码:

units=response.xpath('//table//text()').extract()

1 个答案:

答案 0 :(得分:0)

该网站有点难看(它使用表格进行演示),但是您可以通过这种方式获得所需的任何值(稍后需要在值之下split() ):

Voltage = response.xpath('string(//td[ ./div/span/h2[.="Voltage"] ]/following-sibling::td[2])').extract_first()
PriceSymbol= response.xpath('string(//td[ ./div/span/h2[.="Price Symbol"] ]/following-sibling::td[2])').extract_first()