Scrapy / Python:获取TR项的未知[索引]

时间:2018-04-21 23:51:59

标签: python html xpath scrapy scrapy-spider

我有这个选择器:

sel = response.xpath('//table//tr[td[@class="ad73"]]')

这将返回位于页面不同位置的TR的选择器列表。

有什么方法可以知道每个TR的绝对索引号(从(// TABLE / TR)开始,所以我可以稍后在另一个函数中顺序解决它们吗?

1 个答案:

答案 0 :(得分:0)

不确定你在这里要做什么,但是继续你的评论:

  

在这些TR之后立即使用我需要抓取的数据的其他TR

我会说你需要following-sibling魔法来做它所说的:

sel = response.xpath('//table//tr[td[@class="ad73"]]/following-sibling::tr')

在您确定的那个之后,这将为您提供以下tr