Http charset vs xml编码(utf-8,utf-16等)

时间:2014-11-03 13:33:25

标签: java xml http encoding

我应该使用哪一个来解析xml文件。什么是解析http-xml文件的推荐方法。我的方法是将xml读取为String并使用DocumentBuilder来解析String。 这是正确的做法。

        DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
        Document doc = null;
        InputSource is = null;
        DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();
        is = new InputSource(new StringReader(xmlString));
        doc = dBuilder.parse(is);

1 个答案:

答案 0 :(得分:0)

XML在<!xml encoding="...">默认为UTF-8中指定了自己的编码。 使用String的StringReader,已经假定读取已经在猜测的编码中完成。 这似乎不如使用纯二进制格式(如File或InputStream)推荐。

另一个因素是文档库,用于查找包含的文档xsd,dtd。使用 XML目录可能有所帮助,使这些文件脱机存储。