用scrapy刮特定的表元素

时间:2016-04-16 23:20:25

标签: python html web-scraping scrapy

我正在使用scrapy从特定<td>标记内的网站上抓取内容。本教程向我展示了如何下载所有数据 - 我只想要一个<td>的数据。 HALP!

示例通用表代码:

<table>
<tr>
<td>1,1</td>
<td>1,2</td>
</tr>
<tr>
<td>2,1</td>
<td>2,2</td>
</tr>
</table>

我不知道如何获得2,2值。

提前致谢

1 个答案:

答案 0 :(得分:2)

使用response.css()td快捷方式获取table中的最后一个response.xpath("//table//td[last()]/text()").extract_first() response.xpath("//table//td/text()").extract()[-1] response.css("table td::text").extract()[-1] 元素。例子:

{{1}}