读取Java页面的源代码

时间:2019-06-17 16:22:41

标签: java html http get request

所以我试图获取Java页面的源代码。我所做的是使用HttpURLConnection发出GET请求。我使用BufferedReader读取源代码。但是,我只能读取其中的一部分,此后,BufferedReader对象仅返回null。我也使用过Jsoup,效果很好。因此,我无法真正弄清楚为什么我的第一种方法行不通。这是我的代码:

BufferedReader reader = new BufferedReader(new InputStreamReader(httpURLConnection.getInputStream()));
    while (true) {
        while (reader.ready())
            System.out.println(reader.readLine());
    }

1 个答案:

答案 0 :(得分:1)

问题与检查流中是否有可读取内容的错误方式有关(如RealSkeptic所说)

这是正确的方法:

    while ((line = reader.readLine()) != null) 
        System.out.println(line);