我在Document对象Jsoup中转换了一个XML文档。 事实证明,当我需要输出到String格式时,它会在下面生成以下结果:
<?xml version="1.0" standalone="yes"?>
<NewDataSet xmlns="http://www.portalfiscal.inf.br/nfe">
<nfeProc versao="2.00">
<NFe>
<infNFe versao="2.00" id="NFe31140545453214002014550120002685744002685742">
<cUF>
31
</cUF>
<cNF>
00268574
</cNF>
...
得分产生了这给我带来了很多问题,因为科尔卡在元素内部空白,这给我带来了很大的问题。有没有办法在不改变元素值的情况下生成输出结果? 我已经尝试更改charset并使用preetyprinter,但没有成功。
如果commo生成以下示例,而不修改元素的内容,有一种方法可以做到这一点吗?
<?xml version="1.0" standalone="yes"?>
<NewDataSet xmlns="http://www.portalfiscal.inf.br/nfe">
<nfeProc versao="2.00">
<NFe>
<infNFe versao="2.00" id="NFe31140545453214002014550120002685744002685742">
<cUF>31</cUF>
<cNF>00268574</cNF>
...
编辑:输入
String xml = "";
while (reader.ready()) {
xml += reader.readLine();
}
reader.close();
doc = Jsoup.parse(xml, "", Parser.xmlParser());
输出: 我尝试了各种各样的方法,但总是和上面的结果相同......
doc.toString();
doc.outerHtml();
doc.Html();
尝试了所有返回字符串的方法,但总是返回相同的。
答案 0 :(得分:0)
通常,Jsoup将pretty-print读入xml。您可以使用
关闭该行为doc.outputSettings().prettyPrint(false);
然而,JSoup可能会使用与输入相同的格式。在你的情况下,<cUF>
标签周围也可能包含新行字符,所以你在那里运气不好。
我不确定你的原始xml是如何格式化的。但也许这可能会有所帮助:
while (reader.ready()) {
xml += reader.readLine().replaceAll("\n","");
}
reader.close();
doc = Jsoup.parse(xml, "", Parser.xmlParser());
doc.outputSettings().prettyPrint(false).indentAmount(0);
System.out.print(doc.html());
说明:我在解析之前删除所有NEW LINE字符。然后我将漂亮的打印设置为关闭。