JSoup添加额外的

时间:2012-10-24 12:40:15

标签: jsoup

JSoup似乎在我的输出中添加了额外的br标签,如下所示。有没有办法阻止这种情况发生?

JUnit测试:

@Test
public void testJsoup () throws MLException {
    String htmlBody = "<body> <div> <br class='calibre1'></br> <br class='calibre1'></br></div> </body>"; 
    Document doc = Jsoup.parse(htmlBody);
    htmlBody = doc.select("body").first().toString();
    System.out.println(htmlBody);
}

控制台输出:

<body> 
 <div> 
   <br class="calibre1" />
   <br /> 
   <br class="calibre1" />
   <br />
 </div> 
</body>

此致 丹尼

1 个答案:

答案 0 :(得分:2)

我没有看到任何额外的<br /> - 这里的标签......你的意思是换行吗? 如果是,请查看此处:jsoup line feed

您可以做的是关闭prettyPrint

final String html = "<body> <div> <br class='calibre1'></br> <br class='calibre1'></br></div> </body>";

Document doc = Jsoup.parse(html);

// This line will keep your Html in one line
doc.outputSettings().prettyPrint(false);

System.out.println(doc.body());

<强>输出:

<body> <div> <br class="calibre1" /><br /> <br class="calibre1" /><br /></div> </body>