CharSequence content = new StringBuffer("aaabbbccaaa");
String pattern = "([a-zA-Z])\\1\\1+";
String replace = "-";
Pattern patt = Pattern.compile(pattern, Pattern.CASE_INSENSITIVE);
Matcher matcher = patt.matcher(content);
boolean isMatch = matcher.find();
StringBuffer buffer = new StringBuffer();
for (int i = 0; i < content.length(); i++) {
while (matcher.find()) {
matcher.appendReplacement(buffer, replace);
}
}
matcher.appendTail(buffer);
System.out.println(buffer.toString());
在上面的代码content
中是输入字符串,
我正在尝试从字符串中查找重复出现的内容,并希望将其替换为最大出现次数
例如
输入-("abaaadccc",2)
输出-"abaadcc"
这里aaa
和ccc
分别由aa
和cc
代替,因为允许的最大重复次数为2
在上面的代码中,我发现了这种情况,并尝试用-
替换它们,这是可行的,但是有人可以帮助我如何获取当前的char并替换为允许的情况
即,如果找到aaa
,则替换为aa
还是没有其他使用正则表达式的方法?
答案 0 :(得分:2)
您可以在正则表达式中声明第二个组并将其用作替代:
String result = "aaabbbccaaa".replaceAll("(([a-zA-Z])\\2)\\2+", "$1");
这是它的工作方式:
( first group - a character repeated two times
([a-zA-Z]) second group - a character
\2 a character repeated once
)
\2+ a character repeated at least once more
因此,第一组捕获替换字符串。
不难推断此解决方案的最大允许重复次数的最大值:
String input = "aaaaabbcccccaaa";
int maxRepeats = 4;
String pattern = String.format("(([a-zA-Z])\\2{%s})\\2+", maxRepeats-1);
String result = input.replaceAll(pattern, "$1");
System.out.println(result); //aaaabbccccaaa
答案 1 :(得分:1)
由于您在正则表达式中定义了一个组,因此可以通过调用matcher.group(1)
获得该组的匹配字符。在您的情况下,它包含重复组中的第一个字符,因此通过将其附加两次可以得到预期的结果。
CharSequence content = new StringBuffer("aaabbbccaaa");
String pattern = "([a-zA-Z])\\1\\1+";
Pattern patt = Pattern.compile(pattern, Pattern.CASE_INSENSITIVE);
Matcher matcher = patt.matcher(content);
StringBuffer buffer = new StringBuffer();
while (matcher.find()) {
System.out.println("found : "+matcher.start()+","+matcher.end()+":"+matcher.group(1));
matcher.appendReplacement(buffer, matcher.group(1)+matcher.group(1));
}
matcher.appendTail(buffer);
System.out.println(buffer.toString());
输出:
found : 0,3:a
found : 3,6:b
found : 8,11:a
aabbccaa