我想用 Jsoup 解析页面的 DOCTYPE
,以发现 HTML 的版本( HTML 5 , HTML 4 , XHTML 等。)。
是否可以使用 Jsoup 解析 DOCTYPE
来处理它?如果不是,有一种方法可以实现发现页面HTML版本的主要目标吗?
答案 0 :(得分:9)
Jsoup
有DocumentType
类:
List<Node>nods = doc.childNodes();
for (Node node : nods) {
if (node instanceof DocumentType) {
DocumentType documentType = (DocumentType)node;
System.out.println(documentType.toString());
System.out.println(DocumentType.attr("publicid"));
}
}