我想下载网站的html源代码来解析一些信息。我如何用Java实现这一目标?
答案 0 :(得分:8)
只需从openStream()返回的URL的InputStream中附加一个BufferedReader(或任何读取字符串的内容)。
public static void main(String[] args)
throws IOException
{
URL url = new URL("http://stackoverflow.com/");
BufferedReader reader = new BufferedReader(new InputStreamReader(url.openStream()));
String s = null;
while ((s = reader.readLine()) != null)
System.out.println(s);
}
答案 1 :(得分:0)
您可以直接使用Java类:
URL url = new URL("http://www.example.com");
URLConnection conn = url.openConnection();
InputStream in = conn.getInputStream();
...
但是更推荐使用Apache HttpClient,因为HttpClient将处理你必须自己使用Java本机类做的很多事情。