我正在尝试解析一个相当大的XML文件 - 1MB +,但我遇到了一些困难。 我首先尝试将xml文件添加到res / xml并使用XmlResourceParser解析它,但我得到一个例外,说“数据超过UNCOMPRESS_DATA_MAX”。经过一些研究后,我发现压缩文件在读取之前必须在内存中解压缩,并且此限制不适用于原始文件。 但是,当尝试使用SAXParser解析res / raw文件夹中的xml文件时,我得到一个IOException,没有任何消息和stacktrace:
SAXParserFactory spf = SAXParserFactory.newInstance();
SAXParser sp = spf.newSAXParser();
XMLReader xr = sp.getXMLReader();
xr.setContentHandler(myXMLHandler);
InputSource src = new InputSource(stream);
xr.parse(src); // IOException
根据我的理解,这些内存限制不适用于原始资源,但是导致此异常的是什么呢?
这是来自logcat的堆栈跟踪:
11-11 23:47:50.729: WARN/System.err(4886): java.io.IOException
11-11 23:47:50.739: WARN/System.err(4886): at android.content.res.AssetManager.readAsset(Native Method)
11-11 23:47:50.749: WARN/System.err(4886): at android.content.res.AssetManager.access$800(AssetManager.java:36)
11-11 23:47:50.759: WARN/System.err(4886): at android.content.res.AssetManager$AssetInputStream.read(AssetManager.java:542)
11-11 23:47:50.759: WARN/System.err(4886): at org.apache.harmony.xml.ExpatParser.parseFragment(ExpatParser.java:504)
11-11 23:47:50.769: WARN/System.err(4886): at org.apache.harmony.xml.ExpatParser.parseDocument(ExpatParser.java:467)
11-11 23:47:50.779: WARN/System.err(4886): at org.apache.harmony.xml.ExpatReader.parse(ExpatReader.java:329)
11-11 23:47:50.790: WARN/System.err(4886): at org.apache.harmony.xml.ExpatReader.parse(ExpatReader.java:286)
答案 0 :(得分:0)
使用此linux命令 split -l 1 main.xml
拆分文件private String readTxt()
{
ByteArrayOutputStream byteArrayOutputStream = new ByteArrayOutputStream();
for(int J=1;J<15;J++)
{
int i;
try
{
InputStream raw = this.getAssets().open("xa"+J);
i = raw.read();
while (i != -1)
{
byteArrayOutputStream.write(i);
i = raw.read();
}
raw.close();
}
catch (IOException e)
{
// TODO Auto-generated catch block
e.printStackTrace();
}
}
在SAX解析中用作字符串。