使用Java中的正则表达式转义双斜杠

时间:2011-06-14 19:19:53

标签: java regex string unicode replaceall

我有这个单元测试:

public void testDeEscapeResponse() {
    final String[] inputs = new String[] {"peque\\\\u0f1o", "peque\\u0f1o"};
    final String[] expected = new String[] {"peque\\u0f1o", "peque\\u0f1o"};
    for (int i = 0; i < inputs.length; i++) {
        final String input = inputs[i];
        final String actual = QTIResultParser.deEscapeResponse(input);
        Assert.assertEquals(
            "deEscapeResponse did not work correctly", expected[i], actual);
    }
}

我有这个方法:

static String deEscapeResponse(String str) {
    return str.replaceAll("\\\\", "\\");
}

单元测试失败并出现此错误:

java.lang.StringIndexOutOfBoundsException: String index out of range: 1
    at java.lang.String.charAt(String.java:686)
    at java.util.regex.Matcher.appendReplacement(Matcher.java:703)
    at java.util.regex.Matcher.replaceAll(Matcher.java:813)
    at java.lang.String.replaceAll(String.java:2189)
    at com.acme.MyClass.deEscapeResponse
    at com.acme.MyClassTest.testDeEscapeResponse

为什么?

3 个答案:

答案 0 :(得分:4)

使用String.replace进行文字替换,而不是使用正则表达式的String.replaceAll

示例:

"peque\\\\u0f1o".replace("\\\\", "\\")    //  gives  peque\u0f1o

String.replaceAll采用正则表达式,因此\\\\被解释为表达式 \\,后者又匹配单个\。 (替换字符串也对\有特殊处理,因此也存在错误。)

要使String.replaceAll按预期工作,您需要执行

"peque\\\\u0f1o".replaceAll("\\\\\\\\", "\\\\")

答案 1 :(得分:2)

我认为问题在于您使用的是replaceAll()而不是replace()。 replaceAll期望在第一个字段中使用正则表达式,而您只是尝试字符串匹配。

答案 2 :(得分:1)

请参阅Matcher的javadoc:

  

请注意反斜杠(\)和美元   替换字符串中的符号($)   可能会导致结果不同   而不是被视为一个   字面替换字符串。美元   标志可以作为参考   捕获的子序列如上所述   上面,反斜杠用于   逃避文字中的字符   替换字符串。

因此,对于replaceAll,您无法使用反斜杠替换任何内容。因此,对于您的案例,一个非常疯狂的解决方法是str.replaceAll("\\\\(\\\\)", "$1")