IOException - XML解析

时间:2013-06-06 07:14:59

标签: java xml xml-parsing sax saxparser

我正在尝试从以下网址解析xml响应 -

http://imdbapi.org/?type=xml&q=argo

为此,我写了下面的代码 -

    try
    {
        XMLReader myReader = XMLReaderFactory.createXMLReader();
        xmlHandler handlerobj = new xmlHandler();
        myReader.setContentHandler(handlerobj);
        myReader.parse(new InputSource(new URL("http://imdbapi.org/?type=xml&q=argo").openStream()));
    }
    catch(Exception e)
    {
        System.out.println("Error");
    }       

xmlHandler是一个扩展DefaultHandler的类。 我在上面的代码中得到了 IOException

堆栈追踪 -

java.io.IOException: Server returned HTTP response code: 403 for URL:   http://imdbapi.org/?type=xml&q=argo
at sun.net.www.protocol.http.HttpURLConnection.getInputStream(Unknown Source)
at java.net.URL.openStream(Unknown Source)
at gui.getimdbdata(gui.java:73)
at gui.main(gui.java:64)

此代码有什么问题?

2 个答案:

答案 0 :(得分:2)

您必须设置user.agent:

System.setProperty("http.agent", "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36     (KHTML, like Gecko) Chrome/28.0.1500.29 Safari/537.36");

(如果您使用浏览器连接到URL,则会自动完成)

答案 1 :(得分:0)

解决了这个问题,感谢@dijkstra!

Web服务只允许浏览器获取xml数据。

以下是修改 -

       url = new URL(urlString);
       uc = url.openConnection();
       uc.addRequestProperty("User-Agent", 
                "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)");

       uc.connect();
       uc.getInputStream();
       BufferedInputStream in = new BufferedInputStream(uc.getInputStream());