<input>结束标记无法解析

时间:2019-07-17 11:24:25

标签: jsoup

我正在尝试运行以下代码。似乎输入标签的结束标签已被jsoup删除。如果您看不到html,则输入标签就像<input type="checkbox" readonly checked>一样,没有结束标签。它应该像<input type="checkbox" readonly checked/>一样出现。

String html = "<html><head><title>First parse</title></head>"
  + "<body><p>Parsed HTML into a doc.</p> <input type="checkbox"  readonly="readonly" checked="checked"/> </body></html>";

Document doc = Jsoup.parse(html);

System.out.println(doc.html());

2 个答案:

答案 0 :(得分:0)

Jsoup解析为HTML5。 HTML5中的自动结束标记中不需要结束标记。如果需要自动关闭标签,可以将jsoup配置为解析为XML:

doc.outputSettings().syntax(Document.OutputSettings.Syntax.xml); doc.outputSettings().escapeMode(Entities.EscapeMode.xhtml);

答案 1 :(得分:-1)

在HTML中使用单引号代替双引号

String html = "<html><head><title>First parse</title></head>"
  + "<body><p>Parsed HTML into a doc.</p> <input type='checkbox'  readonly='readonly' checked='checked'/> </body></html>";

Document doc = Jsoup.parse(html);

System.out.println(doc.html());