DocumentBuilder解析产生4字节UTF-8序列错误的无效字节2

时间:2018-04-06 06:09:52

标签: java xml encoding utf-8

我正在尝试解析在XML中包含字符串Impresión的bytearray

final DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
final DocumentBuilder builder = builderFactory.newDocumentBuilder();
final Document document;
try (final InputStream stream = new ByteArrayInputStream(bytearray)) {
     document = builder.parse(stream); // gives Invalid byte 2 of 4-byte UTF-8 sequence error
}

它产生 4字节UTF-8序列的无效字节2 错误。但是当我有Unicode Impresi\u00f3n时,它运行正常。但我想解析实际角色。

任何人帮助我解决它。

0 个答案:

没有答案