如何使用Pattern和Matcher获取所有找到的组

时间:2013-01-21 09:13:58

标签: java regex

我有以下正则表达式模式:^(\d+)(;(\d+))*$。我想得到该正则表达式中的组数和每个组的值。

我尝试过使用groupCount和group但是我得到了以下结果:

Input: "1"
Groups: 3
"1", "1", null, null 
Input: "1;2"
Groups: 3
"1;2", "1", ";2", "2"
Input: "1;2;3"
Groups: 3
"1;2;3", "1", ";3", "3"
Input: "1;2;3;4"
Groups: 3
"1;2;3;4", "1", ";4", "4"

我期待第一个"1"从groupCount获得1。在最后一个"1;2;3;4"的情况下,我期望从groupCount获得7。

Matcher上有什么方法可以返回我期待的内容吗?

编辑:添加了生成上述输出的代码

String input = "1";
Pattern pattern = Pattern.compile("^(\\d+)(;(\\d+))*$");
for (int i = 2; i < 6; ++i) {
    Matcher matcher = pattern.matcher(input);
    matcher.matches();
    System.out.println("Input: \"" + input + "\"\nGroups: " + matcher.groupCount());
    for (int group = 0; group <= matcher.groupCount(); ++group) {
        System.out.print("\"" + matcher.group(group) + "\", ");
    }
    System.out.println();
    input += ";" + i;
}

1 个答案:

答案 0 :(得分:5)

对不起,但是你们对团体存在误解。

您可以使用正则表达式定义组的数量。它不依赖于字符串。在你的正则表达式中,你定义了3组:

 ^(\\d+)(;(\\d+))*$
  1     2 3

小组由左括号编号。所以你的正则表达式总是有3组。如果他们匹配的东西是完全不同的东西。

因此,在第一组中始终会找到第一个找到的数字。对于其他两个群组,您正在做一些特别的事情:您 repeating a capturing group

由于您匹配的以下数字都存储在第3组中,因此您只能在最终结果中找到最后一个数字。在.net中你可以读出所有的匹配,但我认为它不可能用Java。

<强>解决方案:

使用正则表达式验证字符串

^\\d+(;\\d+)*$

如果格式正常,则通过在“;”

上进行拆分来获取数字