如何在字符串中转换Jsoup Document而不放置空格

时间:2014-06-06 18:22:12

标签: jsoup

我在Document对象Jsoup中转换了一个XML文档。 事实证明,当我需要输出到String格式时,它会在下面生成以下结果:

<?xml version="1.0" standalone="yes"?>
<NewDataSet xmlns="http://www.portalfiscal.inf.br/nfe"> 
 <nfeProc versao="2.00">
  <NFe> 
   <infNFe versao="2.00" id="NFe31140545453214002014550120002685744002685742"> 
 <cUF>
   31
 </cUF> 
 <cNF>
  00268574
 </cNF>
...

得分产生了这给我带来了很多问题,因为科尔卡在元素内部空白,这给我带来了很大的问题。有没有办法在不改变元素值的情况下生成输出结果? 我已经尝试更改charset并使用preetyprinter,但没有成功。

如果commo生成以下示例,而不修改元素的内容,有一种方法可以做到这一点吗?

<?xml version="1.0" standalone="yes"?>
<NewDataSet xmlns="http://www.portalfiscal.inf.br/nfe"> 
 <nfeProc versao="2.00">
  <NFe> 
   <infNFe versao="2.00" id="NFe31140545453214002014550120002685744002685742"> 
 <cUF>31</cUF> 
 <cNF>00268574</cNF>
...

编辑:输入

String xml = "";

        while (reader.ready()) {
            xml += reader.readLine();
        }
        reader.close();
        doc = Jsoup.parse(xml, "", Parser.xmlParser());

输出: 我尝试了各种各样的方法,但总是和上面的结果相同......

 doc.toString();
 doc.outerHtml();
 doc.Html();

尝试了所有返回字符串的方法,但总是返回相同的。

1 个答案:

答案 0 :(得分:0)

通常,Jsoup将pretty-print读入xml。您可以使用

关闭该行为
doc.outputSettings().prettyPrint(false);

然而,JSoup可能会使用与输入相同的格式。在你的情况下,<cUF>标签周围也可能包含新行字符,所以你在那里运气不好。

我不确定你的原始xml是如何格式化的。但也许这可能会有所帮助:

while (reader.ready()) {
    xml += reader.readLine().replaceAll("\n","");
}
reader.close();
doc = Jsoup.parse(xml, "", Parser.xmlParser());
doc.outputSettings().prettyPrint(false).indentAmount(0);

System.out.print(doc.html());

说明:我在解析之前删除所有NEW LINE字符。然后我将漂亮的打印设置为关闭。