使用scrapy提取特定数据时出错

时间:2014-03-21 16:56:29

标签: python scrapy

我是python和scrapy的新手。

<a data-install="355 万" data-like="792" data-name="来往" data-pn="com.alibaba.android.babylon" class="install-btn " rel="nofollow" style="display:block;" href="http://apps.wandoujia.com/apps/com.alibaba.android.babylon/download" download="来往.apk" data-track="taginfo-ndownload-com.alibaba.android.babylon">下载</a>

我想提取href。我的代码是:

...
sel = Select(response)
url = sel.xpath('//a[@class="install-btn"]/@href').extract()
...

但结果是空的......

我不知道为什么。有什么建议吗?

2 个答案:

答案 0 :(得分:1)

url = sel.xpath('//a[contains(@class,"install-btn")]/@href').extract()

答案 1 :(得分:0)

或者,使用CSS选择器和Scrapy的::attr()功能伪元素:

url = sel.css('a.install-btn::attr(href)').extract()