Android SAX Parser没有读取网络加载文件(字符编码/编码问题)?

时间:2011-03-24 02:01:02

标签: android xml saxparser

我正在使用Android从网上阅读文档,我在写这里是因为我有问题。对于很多网站我没有问题,但对于一些网站,android中的xml解析器是“脾气暴躁的”。我怀疑它与字符编码有关,但我不确定究竟是什么。特别是如果我用“wget”下载文件并将其提供给android,它可以正常工作....

Android的错误消息,    03-23 21:54:47.383:ERROR / xml(9062):org.apache.harmony.xml.ExpatParser $ ParseException:在第1行第62列:语法错误

下载时的xml似乎很好。

<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd" xmlns:dc="http://purl.org/dc/elements/1.1/" version="2.0">
    <channel>
    ...

我的示例android应用程序....

package com.example.android.helloactivity;

import java.net.URL;

import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.Attributes;
import org.xml.sax.InputSource;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

import android.app.Activity;
import android.os.Bundle;
import android.util.Log;
import android.widget.Toast;

public class HelloActivity extends Activity {

    class EnclosureHandler extends DefaultHandler {
        @Override
        public void characters(char[] ch, int start, int length)
                throws SAXException {
        }

        @Override
        public void endElement(String uri, String localName, String name)
                throws SAXException {
        }

        @Override
        public void startElement(String namespaceURI, String localName,
                String qName, Attributes atts) throws SAXException {
            Log.i("xml", "lname is : " + qName);
        }
    };

    @Override
    public void onCreate(Bundle savedInstanceState) {
        super.onCreate(savedInstanceState);
        setContentView(R.layout.hello_activity);

        try {
            SAXParserFactory spf = SAXParserFactory.newInstance();
            SAXParser sp = spf.newSAXParser();
            InputSource is = new InputSource(new URL(
                    "http://www.hbo.com/podcasts/billmaher/podcast.xml")
                    .openStream());
            sp.parse(is, new EnclosureHandler());
        } catch (Throwable t) {
            Log.e("xml", t.toString());
            Toast.makeText(getApplicationContext(), t.toString(),
                    Toast.LENGTH_LONG).show();

        }

    }
}

1 个答案:

答案 0 :(得分:0)

原来,字符编码不是问题。 HBO.com网站根据USER-AGENT:标头返回不同的内容。因此,如果您使用Android与hbo.com网站交谈,他们会返回一条消息,告诉您如何使用自己的Android客户端访问该网站。他们可能正试图帮助人们使用网络浏览器。更改USER-AGENT然后导致上述程序获得正确(和可解析)的xml文档。