美好的一天,
以下是我的示例输入HTML:
<html>
<head>
<meta>
</head>
<body>
...
</body>
</html>
然后在 Jsoup XmlParser 之后,这是输出:
<html>
<head>
<meta>
</meta>
</head>
<body>
...
</body>
</html>
XmlParser 解析HTML代码而不更改安排 的HTML代码。但是 XmlParser 会在每个标记中放置关闭标记,而不是 将标记结束为示例中的 meta 标记。我想问一下是否存在 是一种使用Jsoup的方法,可以解析HTML代码而无需添加或 从源HTML代码更改任何内容?
请帮忙,谢谢
答案 0 :(得分:0)
您需要知道html源是DOM Tree
。当Jsoup
或其他lib加载html源时,它将生成DOM Tree
。因此它必须具有打开和关闭标签来操作节点。