格式为
的输入字符串$ {ENC}:的 107ec5141234742beec5cb5b1917e2e6 :{ENC} $$ {ENC}:的 d0b2ddf0b9e7b397558c20c6232 37c4f:{ENC} $$ {ENC}:的 85d6f3cd7dcc5c67cad68ae45a0d5afc :{ENC} $$ {ENC}:的 5c0dfb55a843f830 024df0d74993b668 :{ENC} $
如您所见,数据(粗体)以 $ {ENC}:为前缀,后缀为:{ENC} $ 。我想用处理过的数据替换它们之间的所有字符串。
我正在使用正则表达式:
\$\{ENC\}\:(.*?)\:\{ENC\}\$
转义为java后的:
\\$\\{ENC\\}\\:(.*?)\\:\\{ENC\\}\\$
找到匹配并替换字符串。
我的代码示例如下:
String THE_REGEX = "\\$\\{ENC\\}\\:(.*?)\\:\\{ENC\\}\\$";
Pattern THE_PATTERN = Pattern.compile(THE_REGEX);
public static boolean isProcessingRequired(String data){
if(data == null){
return false;
}
return data.matches(THE_REGEX);
}
public String getProcessedString(String dataString){
Matcher matcher = THE_PATTERN.matcher(dataString);
if(matcher.matches()){
String processedData = null;
String dataItem = matcher.group(1);
String procItem = doSomeProcessing(dataItem);
processedData = dataString.replaceAll("\\$\\{ENC\\}:" + encData + ":\\{ENC\\}\\$", procItem);
if(isProcessingRequired(processedData)){
processedData = getProcessedString(processedData);
}
return processedData;
} else {
return dataString;
}
}
public String doSomeProcessing(String str){
// do some processing on the string
// for now:
str = "DONE PROCESSING!!"
return str;
}
但在matcher.group(1)
,我正在
107ec5141234742beec5cb5b1917e2e6:ENC}$${ENC}:d0b2ddf0b9e7b397558c20c623237c4f:{ENC}$${ENC}:85d6f3cd7dcc5c67cad68ae45a0d5afc:{ENC}$${ENC}:5c0dfb55a843f830024df0d74993b668
而不是
107ec5141234742beec5cb5b1917e2e6
我期待的。
我正在使用?在正则表达式,以避免这个问题。 当我在www.regexe.com上试用它时,正则表达式看起来很好
我在这里做错了什么?
答案 0 :(得分:2)
问题是您使用的是Matcher.matches()
而不是Matcher.find()
。
来自javadoc:
public boolean matches()
尝试将整个区域与模式匹配。
public boolean find()
尝试查找与模式匹配的输入序列的下一个子序列。
这是一个解释差异的简单代码:
Matcher matcher = Pattern.compile("\\Q${ENC}\\E(.*?)\\Q{ENC}$\\E").matcher("${ENC}1{ENC}$${ENC}2{ENC}$");
if (matcher.matches()) {
System.out.println(matcher.group(1)); // Will print "1{ENC}$${ENC}2"
}
matcher.reset();
if (matcher.find()) {
System.out.println(matcher.group(1)); // Will print "1"
}