正则表达式创建一个空组?

时间:2013-10-13 21:53:05

标签: regex parsing grouping

我编写了一个rexeg字符串来将日志解析为一组组,但是当日志的可选部分存在时,它会创建一个空组。我在regex中使用?标记了可选部分,但它似乎仍然创建了一个空组。

以下是我尝试过的两个正则表达式;

([0-9]{2}:[0-9]{2}\.[0-9]{2}) - (DMG|KILL):[ ]+(.*?)\[(.*?)\] (?:damaged|killed) (.*?) \[(.*?)\](?: for (\d{0,9}) dmg)?

([0-9]{2}:[0-9]{2}\.[0-9]{2}) - (DMG|KILL):[ ]+(.*?)\[(.*?)\] (?:damaged|killed) (.*?) \[(.*?)\](?: for (\d{0,9})? dmg)?

我的第二个正则表达式在(\d{0,9})结束后有一个问号,因为我认为这可能是创建空组,但似乎不是那样。我正在解析以下行的字符串;

00:00.00 - DMG:     Player [group] damaged Victim [group] for 130 dmg
00:00.00 - KILL:     Player [group] killed Victim [group]

在解析最后一行(无for X damage)时,最后会创建一个空组。

我为这个可怕的正则表达式道歉。


已经证明,我的正则表达式工作正常,感谢评论部分中的@ Sniffer。可以看出here它按预期工作,但是当在我的应用程序中实现时,它没有。

在我的应用程序中,'KILL'行上的matcher.group(7)(最后一个组)(不包含'dmg'的行返回null,而matcher.groupCount()返回7而不是6,表示它在最后找到一个空组。我的正则表达式如下;

private static final Pattern match = Pattern.compile("([0-9]{2}:[0-9]{2}\\.[0-9]{2}) - (DMG|KILL):[ \t]+(.*?)\\[(.*?)\\] (?:damaged|killed) (.*?) \\[(.*?)\\](?: for (\\d{0,9}) dmg)?");

这是我用来匹配模式的代码;

Matcher matcher = DamageEvent.match.matcher(tLine);

if (matcher.matches())
{
    int matches = matcher.groupCount();
    if (matches < 6 || matches > 7)
    {
        System.err.println("Invalid line: " + tLine);
        return null;
    }
    String time = matcher.group(1);
    String type = matcher.group(2);
    String attackerName = matcher.group(3);
    String attackerGroupString = matcher.group(4);
    String victimName = matcher.group(5);
    String victimGroupString = matcher.group(6);
    String damage = "0";

    System.out.println(matches);

    if (matches == 7) // This results as 'true'
    {
        damage = matcher.group(7); // Damage is set to null :(
    }

}

1 个答案:

答案 0 :(得分:5)

这是设计的,例如每Javadoc

如果匹配成功但指定的组未能匹配输入序列的任何部分,则返回 null

以下example

    Matcher m1 = Pattern.compile("(t1)(t2)?(t3)").matcher("t1t3");
    if(m1.matches()) {
        for(int g=1;g<=m1.groupCount();g++){
            System.out.println("Group "+g+": "+m1.group(g));
        }
    }
    System.out.println("--------------");
    Matcher m2 = Pattern.compile("(t1)()(t3)").matcher("t1t3");
    if(m2.matches()) {
        for(int g=1;g<=m2.groupCount();g++){
            System.out.println("Group "+g+": "+m2.group(g));
        }
    }

将输出:

Group 1: t1
Group 2: null
Group 3: t3
--------------
Group 1: t1
Group 2: 
Group 3: t3