服务器为url openStream()返回403

时间:2012-07-02 23:50:17

标签: java html

import java.net.URL;
import java.io.*;
import java.net.MalformedURLException;
import java.util.logging.Level;
import java.util.logging.Logger;
public class Test {
    public static void main(String args[]) {
        try {
            processHTMLFromLink(new URL("http://fwallpapers.com"));
        } catch (MalformedURLException ex) {
            Logger.getLogger(Test.class.getName()).log(Level.SEVERE, null, ex);
        }
    }

    public static int processHTMLFromLink(URL url) {
        InputStream is = null;
        DataInputStream dis;
        String line;
        int count = 0;
        try {
            BufferedReader in = new BufferedReader(new InputStreamReader(url.openStream()));

            while ((line = in.readLine()) != null) {
                System.out.println(line);
            }
        } catch (MalformedURLException mue) {
            System.out.println(mue.toString());
        } catch (IOException ioe) {
            System.out.println(ioe.toString());
        } finally {
            try {
                is.close();
            } catch (IOException ioe) {
                // nothing to see here
            }
        }
        return count;
    }
}

错误:

java.io.IOException: Server returned HTTP response code: 403 for URL: http://fwallpapers.com
Exception in thread "main" java.lang.NullPointerException
    at Test.processHTMLFromLink(Test.java:38)
    at Test.main(Test.java:15)
Java Result: 1

它在浏览器上运行良好。但我得到零点异常。此代码适用于其他链接。任何人都可以帮助我解决这个问题。当我收到403错误时如何获取内容。

3 个答案:

答案 0 :(得分:22)

这是一篇很老的帖子,但如果人们想知道这是如何运作的。

403表示拒绝访问。 有一个解决方案。 如果您希望能够这样做,您必须将用户agant参数设置为“欺骗”网站

这就是我的旧方法的样子:

private InputStream read() {
try {
    return url.openStream();
 } 
catch (IOException e) {
  String error = e.toString();
  throw new RuntimeException(e);
 }
}

将其更改为:(并且对我有用!)

private InputStream read() {
try {
    HttpURLConnection httpcon = (HttpURLConnection) url.openConnection();
    httpcon.addRequestProperty("User-Agent", "Mozilla/4.0");

  return httpcon.getInputStream();
 } catch (IOException e) {
    String error = e.toString();
  throw new RuntimeException(e);
 }
}

答案 1 :(得分:0)

你的错误正在吞噬异常。

当我运行我的代码时,我得到一个HTTP 403 - “禁止”。 Web服务器不允许您这样做。

我的代码适用于http://www.yahoo.com

我是这样做的:

package url;

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.Reader;
import java.net.URL;

/**
 * UrlReader
 * @author Michael
 * @since 3/20/11
 */
public class UrlReader {

    public static void main(String[] args) {
        UrlReader urlReader = new UrlReader();

        for (String url : args) {
            try {
                String contents = urlReader.readContents(url);
                System.out.printf("url: %s contents: %s\n", url, contents);
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }


    public String readContents(String address) throws IOException {
        StringBuilder contents = new StringBuilder(2048);
        BufferedReader br = null;

        try {
            URL url = new URL(address);
            br = new BufferedReader(new InputStreamReader(url.openStream()));
            String line = "";
            while (line != null) {
                line = br.readLine();
                contents.append(line);
            }
        } finally {
            close(br);
        }

        return contents.toString();
    }

    private static void close(Reader br) {
        try {
            if (br != null) {
                br.close();
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

答案 2 :(得分:0)

现在这是一个完全不同的问题,所以我编辑了你的标题。

根据您的编辑,您没有获得空指针异常,您将获得HTTP 403状态,这意味着“禁止”,这意味着您无法访问该资源。