使用Regex查找模式并将其替换为已处理的数据

时间:2015-01-16 07:43:12

标签: java regex

格式为

的输入字符串
  

$ {ENC}:的 107ec5141234742beec5cb5b1917e2e6 :{ENC} $$ {ENC}:的 d0b2ddf0b9e7b397558c20c6232 37c4f:{ENC} $$ {ENC}:的 85d6f3cd7dcc5c67cad68ae45a0d5afc :{ENC} $$ {ENC}:的 5c0dfb55a843f830 024df0d74993b668 :{ENC} $

如您所见,数据(粗体)以 $ {ENC}:为前缀,后缀为:{ENC} $ 。我想用处理过的数据替换它们之间的所有字符串。

我正在使用正则表达式:

\$\{ENC\}\:(.*?)\:\{ENC\}\$
转义为java后的

\\$\\{ENC\\}\\:(.*?)\\:\\{ENC\\}\\$

找到匹配并替换字符串。

我的代码示例如下:

String THE_REGEX = "\\$\\{ENC\\}\\:(.*?)\\:\\{ENC\\}\\$";
Pattern THE_PATTERN = Pattern.compile(THE_REGEX);

public static boolean isProcessingRequired(String data){
      if(data == null){
          return false;
      }

      return data.matches(THE_REGEX);
}


public String getProcessedString(String dataString){


    Matcher matcher = THE_PATTERN.matcher(dataString);
    if(matcher.matches()){

        String processedData = null;
        String dataItem = matcher.group(1);
        String procItem =  doSomeProcessing(dataItem);

        processedData = dataString.replaceAll("\\$\\{ENC\\}:" + encData + ":\\{ENC\\}\\$", procItem);

        if(isProcessingRequired(processedData)){
            processedData = getProcessedString(processedData);
        }

        return processedData;
    } else {
        return dataString;
    }
}

public String doSomeProcessing(String str){

     // do some processing on the string
     // for now:
       str = "DONE PROCESSING!!"

     return str;

}

但在matcher.group(1),我正在

  

107ec5141234742beec5cb5b1917e2e6:ENC}$${ENC}:d0b2ddf0b9e7b397558c20c623237c4f:{ENC}$${ENC}:85d6f3cd7dcc5c67cad68ae45a0d5afc:{ENC}$${ENC}:5c0dfb55a843f830024df0d74993b668

而不是

107ec5141234742beec5cb5b1917e2e6

我期待的。

我正在使用?在正则表达式,以避免这个问题。 当我在www.regexe.com上试用它时,正则表达式看起来很好

enter image description here

我在这里做错了什么?

1 个答案:

答案 0 :(得分:2)

问题是您使用的是Matcher.matches()而不是Matcher.find()

来自javadoc:

  

public boolean matches()

     

尝试将整个区域与模式匹配。


  

public boolean find()

     

尝试查找与模式匹配的输入序列的下一个子序列。

这是一个解释差异的简单代码:

Matcher matcher = Pattern.compile("\\Q${ENC}\\E(.*?)\\Q{ENC}$\\E").matcher("${ENC}1{ENC}$${ENC}2{ENC}$");

if (matcher.matches()) {
    System.out.println(matcher.group(1)); // Will print "1{ENC}$${ENC}2"
}

matcher.reset();

if (matcher.find()) {
    System.out.println(matcher.group(1)); // Will print "1"
}