Question

我已就此进行了一些研究，并没有得出确凿的答案。

这个问题介绍了它的一些途径：How can I download only part of a page?

但话又说回来，我不想只下载页面的随机部分，而是首先下载其中一个标题。

是否有可能以某种方式查询页面，并将其内容流式传输到缓冲区，并在找到标签</head>后立即停止下载（丢弃其余内容）？

编辑：无法向页面本身添加内容，因为我想在我的应用程序中提取网站标题。

想象一下，http://stackoverflow.com作为参数输入。整个页面大约240kb，但如果我在</head>点击时停止下载，那么它只有5kb。允许我为此页面节省大约97％的带宽。

Answer 1

也许这对您来说已经足够了 - 打开URLConnection并从输入流中读取



    public class test {
        public static void main(String[] args) throws Exception {

            URL oracle = new URL("http://www.oracle.com/");
            BufferedReader in = new BufferedReader(
                    new InputStreamReader(oracle.openStream()));

            String inputLine;
            while ((inputLine = in.readLine()) != null){
                if(inputLine.contains("</head>")) break;
                System.out.println(inputLine);
            }
            in.close();
        }

    }

here你有教程

是否可以只下载页面的HEAD标签？

1 个答案: