Question

我是XPath的新手。我正在尝试提取HTML文档中的语言（lang标记中的<html>属性的内容），例如https://policies.google.com/privacy/archive?hl=de。我在这里尝试过这个：

//html[@lang]

但这并没有给我＆＃34; de＆＃34;文档语言的文本。有谁可以帮助我吗？我已经使用ChroPath测试了上述查询。

Answer 1

您的XPath，

//html[@lang]

选择文档中具有html属性的所有@lang元素。

这个XPath，

/html/@lang

选择@lang根元素的html属性。