Question

我想下载网站的html源代码来解析一些信息。我如何用Java实现这一目标？

Answer 1

只需从openStream（）返回的URL的InputStream中附加一个BufferedReader（或任何读取字符串的内容）。

public static void main(String[] args)
        throws IOException
{
    URL url = new URL("http://stackoverflow.com/");
    BufferedReader reader = new BufferedReader(new InputStreamReader(url.openStream()));

    String s = null;
    while ((s = reader.readLine()) != null)
        System.out.println(s);
}

Answer 2

您可以直接使用Java类：

URL url = new URL("http://www.example.com");
URLConnection conn = url.openConnection();
InputStream in = conn.getInputStream();
...

但是更推荐使用Apache HttpClient，因为HttpClient将处理你必须自己使用Java本机类做的很多事情。

Java中有类似于WebClient.DownloadString的东西吗？

2 个答案: