我有一个网站的源代码,其中textmessages以“< h2>”开头并以“< / h2>”结尾。在我的应用程序中,我阅读了源代码并将其转换为字符串。现在我只想阅读这些消息,并尝试过这个:
returned = get.getInternetData("http://blablabla.com");
int start = returned.indexOf("<h2>") + 4;
int end = returned.indexOf("</h2>");
String message = returned.substring(start, end);
问题是我只得到第一条消息!我的想法是使用扫描仪对象并执行类似
的操作while (scan.hasNext("<h2>")) {
}
但扫描仪没有get-methods。如何阅读源代码中的所有消息?
答案 0 :(得分:0)
你应该这样做:
while (returned.indexOf("<h2>", lastIndex)!=-1) {
....
do your thing
...
increment lastIndex
}
答案 1 :(得分:0)
使用Jsoup可以执行此操作:
Document doc = Jsoup.connect("http://blablabla.com").get();
Elements h2Tag = doc.select("h2");
ArrayList<String> messages = new ArrayList<String>();
for(Element mess: h2Tag){
messages.add(mess.text());
}