我正在使用Android从网上阅读文档,我在写这里是因为我有问题。对于很多网站我没有问题,但对于一些网站,android中的xml解析器是“脾气暴躁的”。我怀疑它与字符编码有关,但我不确定究竟是什么。特别是如果我用“wget”下载文件并将其提供给android,它可以正常工作....
Android的错误消息, 03-23 21:54:47.383:ERROR / xml(9062):org.apache.harmony.xml.ExpatParser $ ParseException:在第1行第62列:语法错误
下载时的xml似乎很好。
<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd" xmlns:dc="http://purl.org/dc/elements/1.1/" version="2.0">
<channel>
...
我的示例android应用程序....
package com.example.android.helloactivity;
import java.net.URL;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.Attributes;
import org.xml.sax.InputSource;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
import android.app.Activity;
import android.os.Bundle;
import android.util.Log;
import android.widget.Toast;
public class HelloActivity extends Activity {
class EnclosureHandler extends DefaultHandler {
@Override
public void characters(char[] ch, int start, int length)
throws SAXException {
}
@Override
public void endElement(String uri, String localName, String name)
throws SAXException {
}
@Override
public void startElement(String namespaceURI, String localName,
String qName, Attributes atts) throws SAXException {
Log.i("xml", "lname is : " + qName);
}
};
@Override
public void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.hello_activity);
try {
SAXParserFactory spf = SAXParserFactory.newInstance();
SAXParser sp = spf.newSAXParser();
InputSource is = new InputSource(new URL(
"http://www.hbo.com/podcasts/billmaher/podcast.xml")
.openStream());
sp.parse(is, new EnclosureHandler());
} catch (Throwable t) {
Log.e("xml", t.toString());
Toast.makeText(getApplicationContext(), t.toString(),
Toast.LENGTH_LONG).show();
}
}
}
答案 0 :(得分:0)
原来,字符编码不是问题。 HBO.com网站根据USER-AGENT:标头返回不同的内容。因此,如果您使用Android与hbo.com网站交谈,他们会返回一条消息,告诉您如何使用自己的Android客户端访问该网站。他们可能正试图帮助人们使用网络浏览器。更改USER-AGENT然后导致上述程序获得正确(和可解析)的xml文档。