我可以替换Java正则表达式中的组吗?

时间:2009-06-12 19:39:19

标签: java regex replace regex-group

我有这个代码,我想知道,如果我只能替换Java正则表达式中的组(不是所有模式)。 代码:

 //...
 Pattern p = Pattern.compile("(\\d).*(\\d)");
    String input = "6 example input 4";
    Matcher m = p.matcher(input);
    if (m.find()) {

        //Now I want replace group one ( (\\d) ) with number 
       //and group two (too (\\d) ) with 1, but I don't know how.

    }

7 个答案:

答案 0 :(得分:107)

使用$n(其中n是数字)来引用replaceFirst(...)中捕获的子序列。我假设你想用文字字符串“number”替换第一组,第二组用第一组的值替换。

Pattern p = Pattern.compile("(\\d)(.*)(\\d)");
String input = "6 example input 4";
Matcher m = p.matcher(input);
if (m.find()) {
    // replace first number with "number" and second number with the first
    String output = m.replaceFirst("number $3$1");  // number 46
}

考虑(\D+)代表第二组,而不是(.*)*是一个贪婪的匹配器,并且会首先消耗最后一个数字。然后匹配器在实现最终(\d)无法匹配时,必须回溯,然后才能匹配最终数字。

答案 1 :(得分:47)

您可以使用Matcher#start(group)Matcher#end(group)来构建通用替换方法:

public static String replaceGroup(String regex, String source, int groupToReplace, String replacement) {
    return replaceGroup(regex, source, groupToReplace, 1, replacement);
}

public static String replaceGroup(String regex, String source, int groupToReplace, int groupOccurrence, String replacement) {
    Matcher m = Pattern.compile(regex).matcher(source);
    for (int i = 0; i < groupOccurrence; i++)
        if (!m.find()) return source; // pattern not met, may also throw an exception here
    return new StringBuilder(source).replace(m.start(groupToReplace), m.end(groupToReplace), replacement).toString();
}

public static void main(String[] args) {
    // replace with "%" what was matched by group 1 
    // input: aaa123ccc
    // output: %123ccc
    System.out.println(replaceGroup("([a-z]+)([0-9]+)([a-z]+)", "aaa123ccc", 1, "%"));

    // replace with "!!!" what was matched the 4th time by the group 2
    // input: a1b2c3d4e5
    // output: a1b2c3d!!!e5
    System.out.println(replaceGroup("([a-z])(\\d)", "a1b2c3d4e5", 2, 4, "!!!"));
}

检查 online demo here

答案 2 :(得分:14)

很抱歉击败了一匹死马,但没有人指出这一点是很奇怪的 - &#34;是的,你可以,但这与你在现实生活中使用捕捉群体的方式相反。

如果您按照使用方式使用正则表达式,解决方案就像这样简单:

"6 example input 4".replaceAll("(?:\\d)(.*)(?:\\d)", "number$11");

或者正如下面的shmosel正确指出的那样,

"6 example input 4".replaceAll("\d(.*)\d", "number$11");

...因为在你的正则表达式中没有充分的理由对小数组进行分组。

您通常不会在要放弃的字符串部分上使用捕获组,而是在要使用的字符串部分使用它们保持

如果你真的想要替换你想要替换的组,你可能需要的是一个模板引擎(例如,mustache,ejs,StringTemplate,......)。

除了好奇之外,即使是正则表达式中的非捕获组也只是因为正则表达式引擎需要它们识别并跳过变量文本。例如,在

(?:abc)*(capture me)(?:bcd)*

如果你的输入看起来像是&#34; abcabc 捕获我 bcdbcd&#34;你需要它们。或&#34; abc 抓住我 bcd&#34;甚至只是捕捉我&#34;。

或者反过来说:如果文本总是相同的,并且你没有捕获它,那么根本没有理由使用组。

答案 3 :(得分:9)

通过在.*周围添加parens来添加第三个组,然后将子序列替换为"number" + m.group(2) + "1"。 e.g:

String output = m.replaceFirst("number" + m.group(2) + "1");

答案 4 :(得分:1)

您可以使用matcher.start()和matcher.end()方法获取组位置。因此,使用此位置可以轻松替换任何文本。

答案 5 :(得分:0)

这是一个不同的解决方案,它还允许在多个匹配中替换单个组。 它使用堆栈来反转执行顺序,因此可以安全地执行字符串操作。

private static void demo () {

    final String sourceString = "hello world!";

    final String regex = "(hello) (world)(!)";
    final Pattern pattern = Pattern.compile(regex);

    String result = replaceTextOfMatchGroup(sourceString, pattern, 2, world -> world.toUpperCase());
    System.out.println(result);  // output: hello WORLD!
}

public static String replaceTextOfMatchGroup(String sourceString, Pattern pattern, int groupToReplace, Function<String,String> replaceStrategy) {
    Stack<Integer> startPositions = new Stack<>();
    Stack<Integer> endPositions = new Stack<>();
    Matcher matcher = pattern.matcher(sourceString);

    while (matcher.find()) {
        startPositions.push(matcher.start(groupToReplace));
        endPositions.push(matcher.end(groupToReplace));
    }
    StringBuilder sb = new StringBuilder(sourceString);
    while (! startPositions.isEmpty()) {
        int start = startPositions.pop();
        int end = endPositions.pop();
        if (start >= 0 && end >= 0) {
            sb.replace(start, end, replaceStrategy.apply(sourceString.substring(start, end)));
        }
    }
    return sb.toString();       
}

答案 6 :(得分:0)

从输入中替换密码字段:

{"_csrf":["9d90c85f-ac73-4b15-ad08-ebaa3fa4a005"],"originPassword":["uaas"],"newPassword":["uaas"],"confirmPassword":["uaas"]}



  private static final Pattern PATTERN = Pattern.compile(".*?password.*?\":\\[\"(.*?)\"\\](,\"|}$)", Pattern.CASE_INSENSITIVE);

  private static String replacePassword(String input, String replacement) {
    Matcher m = PATTERN.matcher(input);
    StringBuffer sb = new StringBuffer();
    while (m.find()) {
      Matcher m2 = PATTERN.matcher(m.group(0));
      if (m2.find()) {
        StringBuilder stringBuilder = new StringBuilder(m2.group(0));
        String result = stringBuilder.replace(m2.start(1), m2.end(1), replacement).toString();
        m.appendReplacement(sb, result);
      }
    }
    m.appendTail(sb);
    return sb.toString();
  }

  @Test
  public void test1() {
    String input = "{\"_csrf\":[\"9d90c85f-ac73-4b15-ad08-ebaa3fa4a005\"],\"originPassword\":[\"123\"],\"newPassword\":[\"456\"],\"confirmPassword\":[\"456\"]}";
    String expected = "{\"_csrf\":[\"9d90c85f-ac73-4b15-ad08-ebaa3fa4a005\"],\"originPassword\":[\"**\"],\"newPassword\":[\"**\"],\"confirmPassword\":[\"**\"]}";
    Assert.assertEquals(expected, replacePassword(input, "**"));
  }