访问URL时出错403但在浏览器中工作正常

时间:2011-09-20 13:10:34

标签: java

String url = "http://maps.googleapis.com/maps/api/directions/xml?origin=Chicago,IL&destination=Los+Angeles,CA&waypoints=Joplin,MO|Oklahoma+City,OK&sensor=false";

        URL google = new URL(url);
        HttpURLConnection con = (HttpURLConnection) google.openConnection();

我使用BufferedReader来打印我得到的内容403错误

相同的网址在浏览器中正常运行。任何人都可以建议。

6 个答案:

答案 0 :(得分:7)

它在浏览器中工作但在java代码中不起作用的原因是浏览器添加了一些您在Java代码中缺少的HTTP头,并且服务器需要这些头。我一直处于同样的境地 - 这个网址在Chrome和Chrome插件“简单REST客户端”中都有效,但却无法在Java中运行。在getInputStream()之前添加此行解决了问题:

                connection.addRequestProperty("User-Agent", "Mozilla/4.0");

..即使我从未使用过Mozilla。您的情况可能需要不同的标题。它可能与cookie有关...我在错误流中收到文本,建议我启用cookie。

请注意,您可以通过查看错误文本获取更多信息。这是我的代码:

        try {
            HttpURLConnection connection = ((HttpURLConnection)url.openConnection());
            connection.addRequestProperty("User-Agent", "Mozilla/4.0");
            InputStream input;
            if (connection.getResponseCode() == 200)  // this must be called before 'getErrorStream()' works
                input = connection.getInputStream();
            else input = connection.getErrorStream();
            BufferedReader reader = new BufferedReader(new InputStreamReader(input));
            String msg;
            while ((msg =reader.readLine()) != null)
                System.out.println(msg);
        } catch (IOException e) {
            System.err.println(e);
        }

答案 1 :(得分:2)

HTTP 403禁止状态代码。您必须阅读HttpURLConnection.getErrorStream()以查看来自服务器的响应(可以告诉您为何获得HTTP 403),如果有的话。

答案 2 :(得分:2)

此代码应该可以正常工作。如果您提出了许多请求,那么Google可能只会限制您。我以前见过Google这样做过。您可以尝试使用代理进行验证。

答案 3 :(得分:0)

大多数浏览器在您输入URL时会自动对URL进行编码,但Java URL功能则不会。   您应该使用URLEncoder URL Encoder

对URL进行编码

答案 4 :(得分:0)

我知道这有点晚了,但获取URL内容的最简单方法是使用Apache HttpComponents HttpClient项目:http://hc.apache.org/httpcomponents-client-ga/index.html

答案 5 :(得分:0)

您的原始页面(带有链接)和目标链接页面不是同一域。

原始域和目标域。

我发现区别在于请求标头:

出现403禁止错误,

         request header have one line:
                        Referer: http://original-domain/json2tree/ipfs/ipfsList.html

当我输入网址时,禁止输入403,                           请求标头没有上面的行引用:Original-domain

我终于想出了解决该错误的方法!

在原始域的网页上,您必须添加

              <meta name="referrer" content="no-referrer" />

它将删除或阻止在标头中发送Referer,对链接和发出的Ajax请求均有效