Question

我正在尝试使用Scrapy从here中提取“Comissõessa que pertence / pertenceu”表中的信息。

由于表的数量可以改变（我想提取几个等价页面的信息），我首先找到相关部分

for node in response.xpath('//*[@class = "ARLabel TextBold"]'):
    texto = node.extract()
    if u'Comissões a que pertence' in texto:
        break

然后我试图通过以下方式找到所需信息的一部分：

node.xpath('.//*[@class = "ARTabResultadosLinhaImpar"]')

但会产生一个空列表。

编辑：删除/文字（）

EDIT2：我用一个xpath解决了这个问题：

response.xpath(u"//*[@class = 'ARLabel TextBold' and contains(text(), 'Comissões a que pertence')]/following-sibling::*//span/text()").extract()

Answer 1

您可以使用此Xpath：

//*[@class = "ARLabel TextBold" and contains(text(), 'Comissões a que pertence')]

编辑（获取表格）：

//table[@title='Tabela com as comissões a que pertence / pertenceu']

Mark回答了这是否解决了您的问题