提取HTML文档XPath的语言

时间:2018-04-28 19:27:21

标签: html xpath

我是XPath的新手。我正在尝试提取HTML文档中的语言(lang标记中的<html>属性的内容),例如https://policies.google.com/privacy/archive?hl=de。我在这里尝试过这个:

//html[@lang]

但这并没有给我&#34; de&#34;文档语言的文本。有谁可以帮助我吗?我已经使用ChroPath测试了上述查询。

1 个答案:

答案 0 :(得分:1)

您的XPath,

//html[@lang]

选择文档中具有html属性的所有@lang元素。

这个XPath,

/html/@lang

选择@lang根元素的html属性。