是否可以只下载页面的HEAD标签?

时间:2015-10-29 21:12:57

标签: java http web download get

我已就此进行了一些研究,并没有得出确凿的答案。

这个问题介绍了它的一些途径:How can I download only part of a page?

但话又说回来,我不想只下载页面的随机部分,而是首先下载其中一个标题。

是否有可能以某种方式查询页面,并将其内容流式传输到缓冲区,并在找到标签</head>后立即停止下载(丢弃其余内容)?

编辑: 无法向页面本身添加内容,因为我想在我的应用程序中提取网站标题。

想象一下,http://stackoverflow.com作为参数输入。整个页面大约240kb,但如果我在</head>点击时停止下载,那么它只有5kb。允许我为此页面节省大约97%的带宽。

1 个答案:

答案 0 :(得分:3)

也许这对您来说已经足够了 - 打开URLConnection并从输入流中读取



    public class test {
        public static void main(String[] args) throws Exception {

            URL oracle = new URL("http://www.oracle.com/");
            BufferedReader in = new BufferedReader(
                    new InputStreamReader(oracle.openStream()));

            String inputLine;
            while ((inputLine = in.readLine()) != null){
                if(inputLine.contains("</head>")) break;
                System.out.println(inputLine);
            }
            in.close();
        }

    }

here你有教程