我正在尝试解析在XML中包含字符串Impresión
的bytearray
final DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
final DocumentBuilder builder = builderFactory.newDocumentBuilder();
final Document document;
try (final InputStream stream = new ByteArrayInputStream(bytearray)) {
document = builder.parse(stream); // gives Invalid byte 2 of 4-byte UTF-8 sequence error
}
它产生 4字节UTF-8序列的无效字节2 错误。但是当我有Unicode Impresi\u00f3n
时,它运行正常。但我想解析实际角色。
任何人帮助我解决它。