在Android中解析大型XML文件

时间:2010-11-11 22:29:49

标签: android xml sax

我正在尝试解析一个相当大的XML文件 - 1MB +,但我遇到了一些困难。 我首先尝试将xml文件添加到res / xml并使用XmlResourceParser解析它,但我得到一个例外,说“数据超过UNCOMPRESS_DATA_MAX”。经过一些研究后,我发现压缩文件在读取之前必须在内存中解压缩,并且此限制不适用于原始文件。 但是,当尝试使用SAXParser解析res / raw文件夹中的xml文件时,我得到一个IOException,没有任何消息和stacktrace:

SAXParserFactory spf = SAXParserFactory.newInstance();
SAXParser sp = spf.newSAXParser();
XMLReader xr = sp.getXMLReader();
xr.setContentHandler(myXMLHandler);
InputSource src = new InputSource(stream);
xr.parse(src); // IOException

根据我的理解,这些内存限制不适用于原始资源,但是导致此异常的是什么呢?

这是来自logcat的堆栈跟踪:

11-11 23:47:50.729: WARN/System.err(4886): java.io.IOException
11-11 23:47:50.739: WARN/System.err(4886):     at android.content.res.AssetManager.readAsset(Native Method)
11-11 23:47:50.749: WARN/System.err(4886):     at android.content.res.AssetManager.access$800(AssetManager.java:36)
11-11 23:47:50.759: WARN/System.err(4886):     at android.content.res.AssetManager$AssetInputStream.read(AssetManager.java:542)
11-11 23:47:50.759: WARN/System.err(4886):     at org.apache.harmony.xml.ExpatParser.parseFragment(ExpatParser.java:504)
11-11 23:47:50.769: WARN/System.err(4886):     at org.apache.harmony.xml.ExpatParser.parseDocument(ExpatParser.java:467)
11-11 23:47:50.779: WARN/System.err(4886):     at org.apache.harmony.xml.ExpatReader.parse(ExpatReader.java:329)
11-11 23:47:50.790: WARN/System.err(4886):     at org.apache.harmony.xml.ExpatReader.parse(ExpatReader.java:286)

1 个答案:

答案 0 :(得分:0)

使用此linux命令 split -l 1 main.xml

拆分文件
private String readTxt()
{
    ByteArrayOutputStream byteArrayOutputStream = new ByteArrayOutputStream();
    for(int J=1;J<15;J++)
    {
        int i;
        try
        {
            InputStream raw = this.getAssets().open("xa"+J);    
            i = raw.read();
            while (i != -1)
            {
                byteArrayOutputStream.write(i);
                i = raw.read();
            }
            raw.close();
        }
        catch (IOException e)
        {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
    }

在SAX解析中用作字符串。