Question

我使用xpath查询一个特别难看的HTML文件。我想提取一个埋藏在文档深处的HTML表。但是，不管是从// html /进入层次结构，我还是可以引用表的唯一id属性吗？

显然，由于页面编辑，这种破坏机会也会少得多。

Answer 1

descendant::*[@id='whatever']

如果“ID”不唯一，您将获得所有匹配节点的列表。

Answer 2

您也可以使用：

//table[@id='yourId']

//匹配文档中的任何元素，'table'仅匹配表元素，过滤器（方括号之间）仅检索带有您id的元素。

Answer 3

类似

xpath.evaluate("/html/body/table[@id]");

自从我使用xpath以来已经有一段时间了，所以它可能不完全正确但它已经接近了。