使用java获取网页的源代码?

时间:2014-10-13 17:38:32

标签: java web-scraping

我有一个类似this的网址和以下方法

public static void saveContent( String webURL )throws Exception 
{

    URL website = new URL(webURL);
    URLConnection connection = website.openConnection();
    BufferedReader in = new BufferedReader(
                            new InputStreamReader(
                                connection.getInputStream()));

    StringBuilder response = new StringBuilder();
    String inputLine;

    while ((inputLine = in.readLine()) != null) 
        response.append(inputLine);

    in.close();

    System.out.println(response.toString());
}

但是,当我想要打印网页内容时,它总是会获取主页面的源代码(www.google.com)。

如何解决我的问题?谢谢你的帮助。

1 个答案:

答案 0 :(得分:1)

我将你的代码复制到netbeans,它似乎正常工作。我认为这个问题可能导致方法参数" webURL"中的内容。尝试在调试模式下运行您的应用程序,看看您回到那里的内容。