我正在尝试编写一个Python代码,该代码将访问维基百科上的皇家马德里页面并打印其小队名称
我当前的xpath查询是:
for t in doc.xpath("//table//table/tr[position() > 1]/td[4]/span//text()"):
#print the player's name here
但是这也打印了“借出贷款”表中的玩家。
所以我的问题是如何只选择包含xpath查询中的表的第一个表?或者还有另一种方法可以达到我的目的?
非常感谢。
P.S:该表从维基百科(https://en.wikipedia.org/wiki/Real_Madrid_C.F)上皇家马德里页面的视图源775行开始。
答案 0 :(得分:2)
您可以使用以下XPath:
(//span[@id='Current_squad']/following::table)[1]
这将只选择"当前sqaud"表
要获取播放器列表,您可以使用以下XPath:
(//span[@id='Current_squad']/following::table)[1]//span[@class='fn']//text()