XPath选择包含表的第一个表

时间:2016-01-01 12:13:22

标签: python xpath wikipedia

我正在尝试编写一个Python代码,该代码将访问维基百科上的皇家马德里页面并打印其小队名称

我当前的xpath查询是:

for t in doc.xpath("//table//table/tr[position() > 1]/td[4]/span//text()"):
   #print the player's name here

但是这也打印了“借出贷款”表中的玩家。

所以我的问题是如何只选择包含xpath查询中的表的第一个表?或者还有另一种方法可以达到我的目的?

非常感谢。

P.S:该表从维基百科(https://en.wikipedia.org/wiki/Real_Madrid_C.F)上皇家马德里页面的视图源775行开始。

1 个答案:

答案 0 :(得分:2)

您可以使用以下XPath:

(//span[@id='Current_squad']/following::table)[1]

这将只选择"当前sqaud"表

要获取播放器列表,您可以使用以下XPath:

(//span[@id='Current_squad']/following::table)[1]//span[@class='fn']//text()