Question

我有一个网站的源代码，其中textmessages以“＆lt; h2＆gt;”开头并以“＆lt; / h2＆gt;”结尾。在我的应用程序中，我阅读了源代码并将其转换为字符串。现在我只想阅读这些消息，并尝试过这个：

returned = get.getInternetData("http://blablabla.com");
int start = returned.indexOf("<h2>") + 4;
int end = returned.indexOf("</h2>");
String message = returned.substring(start, end);

问题是我只得到第一条消息！我的想法是使用扫描仪对象并执行类似

的操作

while (scan.hasNext("<h2>")) {
        }

但扫描仪没有get-methods。如何阅读源代码中的所有消息？

Answer 1

你应该这样做：

while (returned.indexOf("<h2>", lastIndex)!=-1) {
   .... 
   do your thing
   ...
   increment lastIndex 
}

Answer 2

使用Jsoup可以执行此操作：

 Document doc = Jsoup.connect("http://blablabla.com").get();
 Elements h2Tag = doc.select("h2");
 ArrayList<String> messages = new ArrayList<String>();
 for(Element mess: h2Tag){
     messages.add(mess.text());
 }

在Java / Android中多次复制字符串的一部分

2 个答案: