编码Cp1252在XML文件中是否无效?

时间:2013-04-22 07:16:00

标签: java xml encoding

我遇到的一些XML文件未能通过格式良好的XML检查,即使它看起来很好(我可能错了。)

我把它简化为一个简单的例子:

<?xml version="1.0" encoding="Cp1252"?>
<jnlp/>

用于执行检查的方法如下:

public static boolean isWellFormedXml(InputStream inputStream) {
    try {
        XMLInputFactory inputFactory = XMLInputFactory.newInstance();
        inputFactory.setProperty(XMLInputFactory.IS_COALESCING, false);
        inputFactory.setProperty(XMLInputFactory.SUPPORT_DTD, false);
        XMLStreamReader reader = inputFactory.createXMLStreamReader(stream);
        try {
            // Scan through all the reader tokens to ensure everything is well formed
            while (reader.hasNext()) {
                reader.next();
            }
        } finally {
            reader.close();
        }
    } catch (XMLStreamException e) {
        // Ignore the exception
        return false;
    }

    return true;
}

我看到的错误是:

javax.xml.stream.XMLStreamException: ParseError at [row,col]:[1,40]

消息:无效的编码名称“Cp1252”。

唯一的问题是 - 我可以在catch上断点并确认此编码名称​​ 解析。那么这里的交易是什么? XML是否也限制允许在序言中使用哪些编码?

1 个答案:

答案 0 :(得分:4)

检查:

http://www.iana.org/assignments/character-sets/character-sets.xml

我猜你正在寻找的编码可能是windows-1252。 Cp1252可能是java中的有效字符集,但在XML中,您不应该使用它(按照该名称)。