有没有办法解析HTML代码但解析后的输出没有改变?

时间:2015-03-30 02:02:44

标签: java html jsoup

美好的一天,

以下是我的示例输入HTML:

<html>
<head>
<meta>
</head>
<body>
...
</body>
</html>

然后在 Jsoup XmlParser 之后,这是输出:

<html>
<head>
<meta>
</meta>
</head>
<body>
...
</body>
</html>

XmlParser 解析HTML代码而不更改安排 的HTML代码。但是 XmlParser 会在每个标记中放置关闭标记,而不是 将标记结束为示例中的 meta 标记。我想问一下是否存在 是一种使用Jsoup的方法,可以解析HTML代码而无需添加或 从源HTML代码更改任何内容?

请帮忙,谢谢

1 个答案:

答案 0 :(得分:0)

您需要知道html源是DOM Tree。当Jsoup或其他lib加载html源时,它将生成DOM Tree。因此它必须具有打开和关闭标签来操作节点。