我目前正在开发一个应用程序,它可以从不同的站点获取特定的文本来处理它们。 现在我正在使用:
URL textUrl = new URL(url);
InputStream in = textUrl.openStream();
BufferedReader bufferReader = new BufferedReader(new InputStreamReader(in));
StringBuilder stringText = new StringBuilder();
String bufferString;
while ((bufferString = bufferReader.readLine()) != null) {
if (bufferString.indexOf("FIND ME AFTER TEXT") > -1) {
break;
}
stringText.append(bufferString);
}
bufferReader.close();
output = stringText.toString();
正如您所看到的,这是下载指定页面的整个html代码并逐行读取。
但由于我正在寻找的具体文本是在这些页面的开头,我的意图不是只逐行阅读,而是只下载当前处理的行,以节省大量的“不必要的”交通 有没有办法做到这一点?如果是这样,怎么样?
(仅从html页面下载特定行会更好,但我想这是不可能的)
提前致谢。