我想了解这个代码块。在第一个中,我们在表达式中寻找什么?
我的理解是它是任何字符(0次或更多次*)后跟0到9之间的任何数字(一次或多次+)后跟任何字符(0次或更多次*)。
执行此操作时,结果为:
Found value: This order was placed for QT3000! OK?
Found value: This order was placed for QT300
Found value: 0
有人可以和我一起讨论吗?
使用捕获组有什么好处?
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class RegexTut3 {
public static void main(String args[]) {
String line = "This order was placed for QT3000! OK?";
String pattern = "(.*)(\\d+)(.*)";
// Create a Pattern object
Pattern r = Pattern.compile(pattern);
// Now create matcher object.
Matcher m = r.matcher(line);
if (m.find()) {
System.out.println("Found value: " + m.group(0));
System.out.println("Found value: " + m.group(1));
System.out.println("Found value: " + m.group(2));
} else {
System.out.println("NO MATCH");
}
}
}
答案 0 :(得分:216)
您遇到的问题是量词的类型。您在第一组中使用了贪婪量词(索引 1 - 索引0代表整个Pattern
),这意味着它将与它可以(并且因为它是任何字符,它将匹配尽可能多的字符以满足下一组的条件)。
简而言之,只要下一组.*
可以匹配某些内容(在这种情况下,最后一位数字),您的第一组\\d+
就会匹配任何内容。
根据第3组,它将匹配最后一位数后的任何内容。
如果您将其更改为第一组中的不情愿量词,您将获得我认为您期望的结果,即 3000 部分。
请注意第一组中的问号。
String line = "This order was placed for QT3000! OK?";
Pattern pattern = Pattern.compile("(.*?)(\\d+)(.*)");
Matcher matcher = pattern.matcher(line);
while (matcher.find()) {
System.out.println("group 1: " + matcher.group(1));
System.out.println("group 2: " + matcher.group(2));
System.out.println("group 3: " + matcher.group(3));
}
输出:
group 1: This order was placed for QT
group 2: 3000
group 3: ! OK?
有关Java Pattern
here的更多信息。
最后,捕获组由圆括号分隔,并且一旦您的Pattern
与输入匹配,就提供了一种非常有用的方法来使用反向引用(以及其他内容)。
在Java 6中,只能按顺序引用组(谨防嵌套组和排序的细微之处)。
在Java 7中,它更容易,因为您可以使用命名组。
答案 1 :(得分:14)
这完全没问题。
m.group(0)
)始终捕获正则表达式所涵盖的整个区域。在这种情况下,它是整个字符串。(.*)(\\d+)
(正则表达式的第一部分)涵盖第一组中的...QT300
和第二组中的0
。(.*)
更改为(.*?)
。有关贪婪与懒惰的更多信息,请查看this site.
答案 2 :(得分:4)
来自doc:
Capturing groups</a> are indexed from left
* to right, starting at one. Group zero denotes the entire pattern, so
* the expression m.group(0) is equivalent to m.group().
因此捕获组0发送整行。
答案 3 :(得分:3)
您的理解是正确的。但是,如果我们走过:
(.*)
将吞下整个字符串; (\\d+)
满意(这就是捕获0
的原因,而不是3000
); (.*)
将捕获其余部分。然而,我不确定作者的原意是什么。