我在尝试解析android上的xml文档时遇到“SAXParseException:意外的文档结束”错误。
有问题的文件来自google weather api,但无论有问题的xml文件(只要xml有效),它似乎都会抛出相同的错误,所以我怀疑这是我的方法的问题,而不是xml。
这是作为学习练习完成的,所以我可能(希望)忽略了一些显而易见的事情=)
我通过在线验证器运行xml,并且它恢复良好。 (不能告诉我它是否有效,因为我没有DTD,但我认为我不需要DTD来解析xml)。
这是我用来尝试解析文件的代码:
private void refreshForecast()
URL url;
try {
url = new URL( "http://192.168.1.66:8000/google4.xml");
URLConnection connection = url.openConnection();
HttpURLConnection httpConnection = (HttpURLConnection)connection;
int responseCode = httpConnection.getResponseCode();
if (responseCode == HttpURLConnection.HTTP_OK) {
InputStream in = httpConnection.getInputStream();
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = dbf.newDocumentBuilder();
// falls over here parsing the xml.
Document dom = db.parse(in);
}
} catch (ManyExceptions e) {
....
}
产生错误的xml的缩减版本是:
<?xml version="1.0"?>
<xml_api_reply version="1">
<weather>
<forecast_information>
<city>Hamilton</city>
</forecast_information>
</weather>
</xml_api_reply>
堆栈跟踪是:
11-20 06:17:24.416: WARN/System.err(406): org.xml.sax.SAXParseException: Unexpected end of document
11-20 06:17:24.416: WARN/System.err(406): at org.apache.harmony.xml.parsers.DocumentBuilderImpl.parse(DocumentBuilderImpl.java:131)
11-20 06:17:24.416: WARN/System.err(406): at javax.xml.parsers.DocumentBuilder.parse(DocumentBuilder.java:110)
11-20 06:17:24.426: WARN/System.err(406): at com.dave.nzweather.WeatherApp.refreshForecast(WeatherApp.java:159)
11-20 06:17:24.426: WARN/System.err(406): at com.dave.nzweather.WeatherApp.onCreate(WeatherApp.java:100)
11-20 06:17:24.426: WARN/System.err(406): at android.app.Instrumentation.callActivityOnCreate(Instrumentation.java:1047)
11-20 06:17:24.438: WARN/System.err(406): at android.app.ActivityThread.performLaunchActivity(ActivityThread.java:2627)
11-20 06:17:24.438: WARN/System.err(406): at android.app.ActivityThread.handleLaunchActivity(ActivityThread.java:2679)
11-20 06:17:24.446: WARN/System.err(406): at android.app.ActivityThread.access$2300(ActivityThread.java:125)
11-20 06:17:24.446: WARN/System.err(406): at android.app.ActivityThread$H.handleMessage(ActivityThread.java:2033)
11-20 06:17:24.456: WARN/System.err(406): at android.os.Handler.dispatchMessage(Handler.java:99)
11-20 06:17:24.456: WARN/System.err(406): at android.os.Looper.loop(Looper.java:123)
11-20 06:17:24.456: WARN/System.err(406): at android.app.ActivityThread.main(ActivityThread.java:4627)
11-20 06:17:24.466: WARN/System.err(406): at java.lang.reflect.Method.invokeNative(Native Method)
11-20 06:17:24.466: WARN/System.err(406): at java.lang.reflect.Method.invoke(Method.java:521)
11-20 06:17:24.466: WARN/System.err(406): at com.android.internal.os.ZygoteInit$MethodAndArgsCaller.run(ZygoteInit.java:868)
11-20 06:17:24.476: WARN/System.err(406): at com.android.internal.os.ZygoteInit.main(ZygoteInit.java:626)
11-20 06:17:24.476: WARN/System.err(406): at dalvik.system.NativeStart.main(Native Method)
11-20 06:17:24.486: WARN/ROGER(406): org.xml.sax.SAXParseException: Unexpected end of document
为了简洁起见,我没有包含原始的xml,但它只是googles feed的标准天气xml。
我还尝试了一些完全不同的xml文件(包括来自http://www.ibm.com/developerworks/xml/library/x-android/的示例),它们都给出了相同的错误。 (当我通过在线xml验证器运行它们时,它们也都会验证完成。)
这让我觉得它不是xml的问题,而是我试图将它提供给解析器的方式。
干杯
Dave Smylie
答案 0 :(得分:4)
解决了(某种程度)......
我看到sax.parser也可以直接接受uri(而不是输入流)。
一旦我尝试了,它解析得很好,而且代码更短了=)
感谢您的帮助。
String weatherFeed = "http://192.168.1.66:8000/google.xml";
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = dbf.newDocumentBuilder();
Document dom = db.parse(weatherFeed);
答案 1 :(得分:3)
查看代码,您似乎正在尝试从网络上的计算机上获取文件。您是否尝试在浏览器中打开该URL以检查它是否真的发送了XML文件?
另外,您也可以通过Wireshark查看手机的答案。我的猜测是你只是没有得到XML文档,而是404错误页面。
答案 2 :(得分:3)
您的问题可能是由编码问题引起的。
尝试通过带有UTF-8编码的ByteArrayInputStream创建inputStream,如下所示,看看是否有效。这个(下面)是我在使用XML字符串时必须使用的,但是它可能仍然是你正在使用的inputestream的一个问题。
String sData = "..Your XML in here..";
DocumentBuilder db = dbf.newDocumentBuilder();
InputStream is = new ByteArrayInputStream(sData.getBytes("UTF-8"));
Document doc = db.parse(is);
这假设你的XML具有像这样指定的UTF-8编码
<?xml version="1.0" encoding="UTF-8" ?>
否则,您应该确保在InputStream中定义的编码与XML中定义的编码相同。