我已就此进行了一些研究,并没有得出确凿的答案。
这个问题介绍了它的一些途径:How can I download only part of a page?
但话又说回来,我不想只下载页面的随机部分,而是首先下载其中一个标题。
是否有可能以某种方式查询页面,并将其内容流式传输到缓冲区,并在找到标签</head>
后立即停止下载(丢弃其余内容)?
编辑: 无法向页面本身添加内容,因为我想在我的应用程序中提取网站标题。
想象一下,http://stackoverflow.com
作为参数输入。整个页面大约240kb,但如果我在</head>
点击时停止下载,那么它只有5kb。允许我为此页面节省大约97%的带宽。
答案 0 :(得分:3)
也许这对您来说已经足够了 - 打开URLConnection并从输入流中读取
public class test {
public static void main(String[] args) throws Exception {
URL oracle = new URL("http://www.oracle.com/");
BufferedReader in = new BufferedReader(
new InputStreamReader(oracle.openStream()));
String inputLine;
while ((inputLine = in.readLine()) != null){
if(inputLine.contains("</head>")) break;
System.out.println(inputLine);
}
in.close();
}
}
here你有教程