Java读取标题等特定项目

时间:2014-10-12 17:30:55

标签: java html url bufferedreader

我正在尝试从我已输入并存储在str1中的网站上读取文本(html)。我已经能够打开网站并打印里面的所有HTML代码。但我想要做的只是在<title><\title>之间打印单词,这样我就可以打印页面的标题了。

URL oracle = new URL(str1);
    BufferedReader in = new BufferedReader(
    new InputStreamReader(oracle.openStream()));

    String inputLine;
    while ((inputLine = in.readLine()) != null)
        System.out.println(inputLine);
    in.close();

1 个答案:

答案 0 :(得分:0)

您可以使用StringBuilder读出所有行并将其附加到一个字符串中。您可以轻松搜索此字符串中的<title></title>

查看indexOfsplit等字符串函数,以准确了解这些标记之间的内容。

我建议阅读此内容。 http://docs.oracle.com/javase/6/docs/api/java/lang/String.html