java在字符串中获取下一个单词

时间:2014-04-16 04:24:17

标签: java html string search split

我正在尝试搜索包含HTML的.txt文件。我需要在文件中搜索特定的HTML标记,然后获取以下几个代码字符。我是java新手,但我愿意学习我需要的东西。

例如:假设我有代码:<span class="date">Apr 13</span>,我需要的是日期(4月13日)。我该怎么做呢?

非常感谢!

4 个答案:

答案 0 :(得分:0)

查看String class docs并尝试找到搜索字符串的方法。

  • 由于您说是从HTML文件中获取它,因此您可以查看Jsoup这是一个HTML解析器,这将使HTML文档中的字符串搜索变得更加容易。

使用jsoup,你可以这样做

File input = new File("input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");

Elements spans = doc.select("span"); 
for (Element element : spans) {
    System.out.println(element.html());
}

答案 1 :(得分:0)

试试这个

    Matcher m = Pattern.compile(">(.*?)<").matcher(s);
    while(m.find()) {
        String s = m.group(1);
    }

答案 2 :(得分:0)

如果你想要的是基本(我认为这样你会很好),你可以使用它:

if(s.indexOf("span class=\"date\"")!=0)
s=s.substring(s.indexOf(">")+1,s.lastIndexOf("<"));

但是,对于您的问题,这个答案具体而不是广泛的答案

答案 3 :(得分:0)

String yourString = "<span class=\"date\">Apr 13</span>"
String date = yourString.split("class=\"date\">")[1].split("</sp")[0];