我正在尝试搜索包含HTML的.txt文件。我需要在文件中搜索特定的HTML标记,然后获取以下几个代码字符。我是java新手,但我愿意学习我需要的东西。
例如:假设我有代码:<span class="date">Apr 13</span>
,我需要的是日期(4月13日)。我该怎么做呢?
非常感谢!
答案 0 :(得分:0)
查看String class docs并尝试找到搜索字符串的方法。
使用jsoup,你可以这样做
File input = new File("input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");
Elements spans = doc.select("span");
for (Element element : spans) {
System.out.println(element.html());
}
答案 1 :(得分:0)
试试这个
Matcher m = Pattern.compile(">(.*?)<").matcher(s);
while(m.find()) {
String s = m.group(1);
}
答案 2 :(得分:0)
如果你想要的是基本(我认为这样你会很好),你可以使用它:
if(s.indexOf("span class=\"date\"")!=0)
s=s.substring(s.indexOf(">")+1,s.lastIndexOf("<"));
但是,对于您的问题,这个答案具体而不是广泛的答案
答案 3 :(得分:0)
String yourString = "<span class=\"date\">Apr 13</span>"
String date = yourString.split("class=\"date\">")[1].split("</sp")[0];