Jaxb编组错误的字符

时间:2014-06-04 13:37:47

标签: java utf-8 jaxb

我曾经通过调用toXml()来编组我的模型:

@XmlRootElement
public class MyModel {

    private String body;

    public String getBody() {
        return this.body;
    }

    public void setBody(final String _body) {
        this.body = _body;
    }

    public String toXML() throws JAXBException {
        final JAXBContext context = JAXBContext.newInstance(MyModel.class);
        final Marshaller marshaller = context.createMarshaller();
        marshaller.setProperty(Marshaller.JAXB_ENCODING, "UTF-8");
        final StringWriter writer = new StringWriter();
        marshaller.marshal(this, writer);
        return writer.toString();
    }
}

如果我将其写入文件或通过流写入webdav-target,则在使用ä作为文本值时会导致无效的xml。

final MyModel m = new MyModel();
m.setBody("\u00E4");

final FileWriter w = new FileWriter("D:\\outtest.xml");
w.write(m.toXML());
w.close();

XMl是这样的(在npp中看起来是另一个并且在切换到ansi时是正确的):

<?xml version="1.0" encoding="UTF-8" standalone="yes"?><myModel><body>伯</body></myModel>

我需要一个提示来解决这个问题!


好的,这可以正常工作(Thx!):

final MyModel m = new MyModel();
m.setBody("\u00E4");
final FileOutputStream s = new FileOutputStream("D:\\outtest.xml");
final OutputStreamWriter osw = new OutputStreamWriter(s, Charset.forName("UTF-8"));
osw.write(m.toXML());
osw.close();

我现在的问题是,这个文件测试是简化版本;-)
我调用toXml()并将此字符串写为JPA-moodel。稍后应该使用框架类将其写入webdav,该框架类将ByteArrayInputStream作为输入。所以我使用这段代码:

final ByteArrayInputStream stream = new ByteArrayInputStream(jpaModel.getXmlString().getBytes());

...写这个我终于明白了。使用更详细的&#39; getBytes(Charset.forName("UTF-8"))帮助我!感谢

1 个答案:

答案 0 :(得分:2)

好的,现在我们知道您是如何编写文件的,这就是问题所在:

FileWriter w = new FileWriter("D:\\outtest.xml");

总是使用平台默认编码 - 即使您已告诉JAXB您将使用UTF-8。这有点像为JPEG创建数据,但随后将其另存为.png文件。使用包含在FileOutputStream中的OutputStreamWriter使用UTF-8,一切都很好。

如果您正在使用Java 7,则可以简化此操作:

try (Writer writer = Files.newBufferedWriter(path, StandardCharsets.UTF_8)) {
    writer.write(m.toXML());
}

或者,您可能希望更改toXML方法以接受OutputStream来写入数据,而不是返回字符串。