我使用xpath查询一个特别难看的HTML文件。我想提取一个埋藏在文档深处的HTML表。但是,不管是从// html /进入层次结构,我还是可以引用表的唯一id属性吗?
显然,由于页面编辑,这种破坏机会也会少得多。
答案 0 :(得分:2)
descendant::*[@id='whatever']
如果“ID”不唯一,您将获得所有匹配节点的列表。
答案 1 :(得分:1)
您也可以使用:
//table[@id='yourId']
//匹配文档中的任何元素,'table'仅匹配表元素,过滤器(方括号之间)仅检索带有您id的元素。
答案 2 :(得分:0)
类似
xpath.evaluate("/html/body/table[@id]");
自从我使用xpath以来已经有一段时间了,所以它可能不完全正确但它已经接近了。