字符更改时拆分字符串。可能的Regex解决方案?

时间:2013-02-26 23:36:11

标签: java regex string character

我有一些String只由数字组成,我想在角色发生变化时拆分它。

例如:

  • "11101100112021120"转到:{"111", "11", "11", "2", "2", "11", "2"}
  • "222222222"转到{"222222222"}
  • "222222122"转到{"222222", "1", "22"}
  • "000000000"转到{}
  • "0000100000"转到{"1"}
  • "11121222212112133321"转到{"111", "2", "1", "2222", "1", "2", "11", "2", "1", "333", "2", "1"}

我想要一个很好的方法来做到这一点。

我知道有两种方法可以解决这个问题:只是强制执行,或逐节添加。或者,我可以通过删除所有0并替换为0,然后在字符更改时添加0,然后在0上进行拆分,但这两种方式看起来都很愚蠢。如果有人对更好/更漂亮的方式有任何想法,正则表达式或逻辑,那就太好了。

2 个答案:

答案 0 :(得分:6)

这似乎与您期望的一样

data.split("0+|(?<=([1-9]))(?=[1-9])(?!\\1)");

测试:

String[] tests = { "11101100112021120", "222222222", "222222122",
        "000000000", "0000100000", "11121222212112133321" };

for (String data : tests) {
    System.out.println(data + " ->" + Arrays.toString(data.split("0+|(?<=([1-9]))(?=[1-9])(?!\\1)")));
    System.out.println("-----------------------");
}

输出:

11101100112021120 ->[111, 11, 11, 2, 2, 11, 2]
-----------------------
222222222 ->[222222222]
-----------------------
222222122 ->[222222, 1, 22]
-----------------------
000000000 ->[]
-----------------------
0000100000 ->[, 1]     // <-- only problem - empty first element 
-----------------------
11121222212112133321 ->[111, 2, 1, 2222, 1, 2, 11, 2, 1, 333, 2, 1]
-----------------------

不幸的是,前导零会让数组包含额外的空字符串。要摆脱它,您可以使用data.replaceFirst("^0+(?=[^0])", "")

删除这些零

答案 1 :(得分:2)

尝试

 str.split( "0+|(?<=(\\d))(?!\\1)" )

对于包含零的字符串,您必须遍历数组并删除所有空元素。