Question

我在Document对象Jsoup中转换了一个XML文档。事实证明，当我需要输出到String格式时，它会在下面生成以下结果：

<?xml version="1.0" standalone="yes"?>
<NewDataSet xmlns="http://www.portalfiscal.inf.br/nfe"> 
 <nfeProc versao="2.00">
  <NFe> 
   <infNFe versao="2.00" id="NFe31140545453214002014550120002685744002685742"> 
 <cUF>
   31
 </cUF> 
 <cNF>
  00268574
 </cNF>
...

得分产生了这给我带来了很多问题，因为科尔卡在元素内部空白，这给我带来了很大的问题。有没有办法在不改变元素值的情况下生成输出结果？我已经尝试更改charset并使用preetyprinter，但没有成功。

如果commo生成以下示例，而不修改元素的内容，有一种方法可以做到这一点吗？

<?xml version="1.0" standalone="yes"?>
<NewDataSet xmlns="http://www.portalfiscal.inf.br/nfe"> 
 <nfeProc versao="2.00">
  <NFe> 
   <infNFe versao="2.00" id="NFe31140545453214002014550120002685744002685742"> 
 <cUF>31</cUF> 
 <cNF>00268574</cNF>
...

编辑：输入

String xml = "";

        while (reader.ready()) {
            xml += reader.readLine();
        }
        reader.close();
        doc = Jsoup.parse(xml, "", Parser.xmlParser());

输出：我尝试了各种各样的方法，但总是和上面的结果相同......

 doc.toString();
 doc.outerHtml();
 doc.Html();

尝试了所有返回字符串的方法，但总是返回相同的。

Answer 1

通常，Jsoup将pretty-print读入xml。您可以使用

关闭该行为

doc.outputSettings().prettyPrint(false);

然而，JSoup可能会使用与输入相同的格式。在你的情况下，<cUF>标签周围也可能包含新行字符，所以你在那里运气不好。

我不确定你的原始xml是如何格式化的。但也许这可能会有所帮助：

while (reader.ready()) {
    xml += reader.readLine().replaceAll("\n","");
}
reader.close();
doc = Jsoup.parse(xml, "", Parser.xmlParser());
doc.outputSettings().prettyPrint(false).indentAmount(0);

System.out.print(doc.html());

说明：我在解析之前删除所有NEW LINE字符。然后我将漂亮的打印设置为关闭。

如何在字符串中转换Jsoup Document而不放置空格

1 个答案: