使用Jsoup从网页中提取语言

时间:2015-04-01 12:06:48

标签: java jsoup

例如我有

<html lang="en"> ...... web page </html>

我想用Jsoup提取字符串“en”。

我尝试使用选择器和属性但没有成功。

Document htmlDoc = Jsoup.parse(html);
Element taglang = htmlDoc.select("html").first();
System.out.println(taglang.text());

1 个答案:

答案 0 :(得分:5)

您希望获得lang 属性的值。在这种情况下,您可以使用attr("nameOfAttribute")之类的

System.out.println(taglang.attr("lang"));