如何用允许的最大出现次数替换字符的多个连续出现?

时间:2019-07-16 08:42:09

标签: java regex string

CharSequence content = new StringBuffer("aaabbbccaaa");
String pattern = "([a-zA-Z])\\1\\1+";
String replace = "-";

Pattern patt = Pattern.compile(pattern, Pattern.CASE_INSENSITIVE);
Matcher matcher = patt.matcher(content);

boolean isMatch = matcher.find();
StringBuffer buffer = new StringBuffer();

for (int i = 0; i < content.length(); i++) {
    while (matcher.find()) {
        matcher.appendReplacement(buffer, replace);
    }
}
matcher.appendTail(buffer);
System.out.println(buffer.toString());

在上面的代码content中是输入字符串,

我正在尝试从字符串中查找重复出现的内容,并希望将其替换为最大出现次数

例如

输入-("abaaadccc",2)
输出-"abaadcc"
这里aaaccc分别由aacc代替,因为允许的最大重复次数为2

在上面的代码中,我发现了这种情况,并尝试用-替换它们,这是可行的,但是有人可以帮助我如何获取当前的char并替换为允许的情况

即,如果找到aaa,则替换为aa

还是没有其他使用正则表达式的方法?

2 个答案:

答案 0 :(得分:2)

您可以在正则表达式中声明第二个组并将其用作替代:

String result = "aaabbbccaaa".replaceAll("(([a-zA-Z])\\2)\\2+", "$1");

这是它的工作方式:

(                        first group - a character repeated two times
    ([a-zA-Z])           second group - a character
    \2                   a character repeated once
)                        
\2+                      a character repeated at least once more

因此,第一组捕获替换字符串。

不难推断此解决方案的最大允许重复次数的最大值:

String input = "aaaaabbcccccaaa";
int maxRepeats = 4;
String pattern = String.format("(([a-zA-Z])\\2{%s})\\2+", maxRepeats-1);
String result = input.replaceAll(pattern, "$1");
System.out.println(result); //aaaabbccccaaa

答案 1 :(得分:1)

由于您在正则表达式中定义了一个组,因此可以通过调用matcher.group(1)获得该组的匹配字符。在您的情况下,它包含重复组中的第一个字符,因此通过将其附加两次可以得到预期的结果。

    CharSequence content = new StringBuffer("aaabbbccaaa");
    String pattern = "([a-zA-Z])\\1\\1+";

    Pattern patt = Pattern.compile(pattern, Pattern.CASE_INSENSITIVE);
    Matcher matcher = patt.matcher(content);

    StringBuffer buffer = new StringBuffer();

    while (matcher.find()) {
        System.out.println("found : "+matcher.start()+","+matcher.end()+":"+matcher.group(1));
        matcher.appendReplacement(buffer, matcher.group(1)+matcher.group(1));
    }
    matcher.appendTail(buffer);
    System.out.println(buffer.toString());

输出:

found : 0,3:a
found : 3,6:b
found : 8,11:a
aabbccaa