应用错误收集

如何使用XPath选择页面上的所有链接

时间：2012-06-14 10:13:11

标签： xpath xpointer

我想编写一个标识特定HTML页面上所有链接的函数。我的想法是使用XPath，使用//body//a[x]之类的路径并递增x来浏览页面上的第一，第二，第三个链接。

在Chrome中尝试此操作时，我会加载页面http://exoplanet.eu/，并在Chrome开发者工具JS控制台中调用$x("//body//a[1]")。我期待页面上的第一个链接，但这会返回多个锚元素的列表。调用$x("//body//a[2]")会返回两个锚元素。调用$x("//body//a[3]")不会返回任何内容。

我希望每次递增[x]会在页面上逐一给出每个唯一的链接，但它们似乎是分组的。如何重写此路径以便逐个选择每个锚标记？

2 个答案:

答案 0 :(得分：6)

如果您要选择页面上的第一个链接，则//body//a[1]应为(//body//a)[1]。前一个表达式选择任何元素作为其父元素的第一个子元素。

但无论如何，这似乎是一件非常奇怪的事情。为什么你需要逐个链接？只需使用//body//a选择所有这些作为节点列表或节点集，然后迭代该集合。

答案 1 :(得分：0)

如果您使用路径//body/descendant::a[1]，//body/descendant::a[2]等，则可以选择a元素的所有后代body元素。或者您的尝试需要大括号，例如(//body//a)[1]，(//body//a)[2]等等。

但请注意，在使用Javascript的浏览器中，对象模型中有一个document.links集合，因此访问链接不需要XPath。