如何使用Java中的regex在一行中查找多个匹配项?
我的代码(包含正则表达式):
public static List<String> getTitles(String html) {
List<String> titles = new ArrayList<String>();
String pattern = "(.*)rel=\"bookmark\">(.*)</a></h2>";
Pattern p = Pattern.compile(pattern);
Matcher m = p.matcher(html);
while (m.find())
System.out.println(m.group(2));
return titles;
}
我在其中使用的部分字符串:
... title="Permalink to Jet Racing Extreme – Alpha Download" rel="bookmark">Jet Racing Extreme – Alpha Download</a></h2><div class="entry-meta"> Posted on <a ...
这适用于第一次出现(实际上是整个字符串),但由于整个字符串被认为是第一次出现,所以它没有进一步查看。
我希望你能理解我想说的话,我不知道如何更清楚地解释它。
- 编辑 我也尝试用这个替换正则表达式:
rel="bookmark">(.*)</a></h2>
我认为这样做只会考虑一行字符串的一部分,从而解决我的问题。然而,仅仅采取行动:
rel="bookmark">Jet Racing Extreme – Alpha Download</a></h2>
当它出现时,它还需要它背后的一切吗?
rel="bookmark">Jet Racing Extreme – Alpha Download</a></h2><divclass="entry-meta"> Posted on <ahref="http://www.alphabetagamer.com/jet-racing-extreme-alpha-download/" title="7:29 pm" rel="bookmark"> ...