我正在尝试运行以下代码。似乎输入标签的结束标签已被jsoup删除。如果您看不到html,则输入标签就像<input type="checkbox" readonly checked>
一样,没有结束标签。它应该像<input type="checkbox" readonly checked/>
一样出现。
String html = "<html><head><title>First parse</title></head>"
+ "<body><p>Parsed HTML into a doc.</p> <input type="checkbox" readonly="readonly" checked="checked"/> </body></html>";
Document doc = Jsoup.parse(html);
System.out.println(doc.html());
答案 0 :(得分:0)
Jsoup解析为HTML5。 HTML5中的自动结束标记中不需要结束标记。如果需要自动关闭标签,可以将jsoup配置为解析为XML:
doc.outputSettings().syntax(Document.OutputSettings.Syntax.xml);
doc.outputSettings().escapeMode(Entities.EscapeMode.xhtml);
答案 1 :(得分:-1)
在HTML中使用单引号代替双引号
String html = "<html><head><title>First parse</title></head>"
+ "<body><p>Parsed HTML into a doc.</p> <input type='checkbox' readonly='readonly' checked='checked'/> </body></html>";
Document doc = Jsoup.parse(html);
System.out.println(doc.html());