我正在尝试使用来自amazon.co.uk的Scrapy一些信息,使用如下的绝对路径。但奇怪的是没有返回任何价值。我是Scrapy的新手:
scrapy shell http://www.amazon.co.uk/product-reviews/B0042EU3A2/
response.xpath('//*[@id="productReviews"]/tbody/tr/td[1]/a[1]/@name').extract()
我想在这种情况下返回name属性是:RI4HGFJCSI04W
。
答案 0 :(得分:3)
只需忽略表达式中的tbody
:
In [1]: response.xpath('//*[@id="productReviews"]//tr/td[1]/a[1]/@name').extract()
Out[1]: [u'RI4HGFJCSI04W']