使用正则表达式解析数组语法

时间:2014-03-29 11:45:49

标签: java regex arrays text-parsing

我认为我所要求的要么是非常微不足道,要么已经被问过,但我很难找到答案。

我们需要捕获给定字符串中括号之间的内部数字字符。

所以给出了字符串

StringWithMultiArrayAccess[0][9][4][45][1]

和正则表达式

^\w*?(\[(\d+)\])+?

我希望有6个捕获组并可以访问内部数据。 但是,我最终只捕获了捕获组2中的最后一个“1”字符。

如果重要的是继承我的java junit测试:

@Test
public void ensureThatJsonHandlerCanHandleNestedArrays(){
    String stringWithArr = "StringWithMultiArray[0][0][4][45][1]";
    Pattern pattern = Pattern.compile("^\\w*?(\\[(\\d+)\\])+?");


    Matcher matcher = pattern.matcher(stringWithArr);
    matcher.find();

    assertTrue(matcher.matches()); //passes

    System.out.println(matcher.group(2));  //prints 1 (matched from last array symbols)

    assertEquals("0", matcher.group(2)); //expected but its 1 not zero
    assertEquals("45", matcher.group(5));  //only 2 capture groups exist, the whole string and the 1 from the last array brackets

}

1 个答案:

答案 0 :(得分:1)

为了捕获每个数字,你需要改变你的正则表达式,使它(a)捕获一个数字,(b)不锚定 - 因此受限于 - 字符串的任何其他部分(“^ \ w *?“将它锚定到字符串的开头)。然后你可以遍历它们:

Matcher mtchr = Pattern.compile("\\[(\\d+)\\]").matcher(arrayAsStr);
while(mtchr.find())  {
   System.out.print(mtchr.group(1) + " ");
}

输出:

0 9 4 45 1