我在Java中有一个特定的文本,我想使用模式和匹配器从中提取一些东西。这是我的计划:
public String getItemsByType(String text, String start, String end) {
String patternHolder;
StringBuffer itemLines = new StringBuffer();
patternHolder = start + ".*" + end;
Pattern pattern = Pattern.compile(patternHolder);
Matcher matcher = pattern.matcher(text);
while (matcher.find()) {
itemLines.append(text.substring(matcher.start(), matcher.end())
+ "\n");
}
return itemLines.toString();
}
当搜索到的文本在同一行时,此代码完全有效,例如:
String text = "My name is John and I am 18 years Old";
getItemsByType(text, "My", "John");
立即从文本中抓取“我的名字是约翰”字样。但是,当我的文字看起来像这样:
String text = "My name\nis John\nand I'm\n18 years\nold";
getItemsByType(text, "My", "John");
它没有抓住任何东西,因为“我的”和“约翰”在不同的行上。我该如何解决这个问题?
答案 0 :(得分:7)
请改用:
Pattern.compile(patternHolder, Pattern.DOTALL);
从javadoc开始,DOTALL
标志表示:
启用dotall模式。
在dotall模式下,表达式。匹配任何字符,包括行终止符。默认情况下,此表达式与行终止符不匹配。
答案 1 :(得分:1)
使用Pattern.compile(patternHolder, Pattern.DOTALL)
编译模式。这样点将与换行符匹配。默认情况下,换行以特殊方式处理,不与点匹配。