我们如何使用JAVA下载HTML页面?
答案 0 :(得分:10)
以下是代码:
public static String savePage(final String URL) throws IOException {
String line = "", all = "";
URL myUrl = null;
BufferedReader in = null;
try {
myUrl = new URL(URL);
in = new BufferedReader(new InputStreamReader(myUrl.openStream()));
while ((line = in.readLine()) != null) {
all += line;
}
} finally {
if (in != null) {
in.close();
}
}
return all;
}
现在你可以在while循环中一个接一个地处理一行。
答案 1 :(得分:2)
如果您有更多要求,例如身份验证,则可以使用HttpClient
答案 2 :(得分:2)
如果您可以使用编译为java字节码的Groovy,则可以获取如下页面:
String text = new URL("http://google.com").text