JSoup似乎在我的输出中添加了额外的br标签,如下所示。有没有办法阻止这种情况发生?
JUnit测试:
@Test
public void testJsoup () throws MLException {
String htmlBody = "<body> <div> <br class='calibre1'></br> <br class='calibre1'></br></div> </body>";
Document doc = Jsoup.parse(htmlBody);
htmlBody = doc.select("body").first().toString();
System.out.println(htmlBody);
}
控制台输出:
<body>
<div>
<br class="calibre1" />
<br />
<br class="calibre1" />
<br />
</div>
</body>
此致 丹尼
答案 0 :(得分:2)
我没有看到任何额外的<br />
- 这里的标签......你的意思是换行吗?
如果是,请查看此处:jsoup line feed
您可以做的是关闭prettyPrint
:
final String html = "<body> <div> <br class='calibre1'></br> <br class='calibre1'></br></div> </body>";
Document doc = Jsoup.parse(html);
// This line will keep your Html in one line
doc.outputSettings().prettyPrint(false);
System.out.println(doc.body());
<强>输出:强>
<body> <div> <br class="calibre1" /><br /> <br class="calibre1" /><br /></div> </body>