正则表达式匹配2个字符串+ Java中的所有匹配项

时间:2019-01-25 19:14:43

标签: java regex

我需要使用Java在2个特定单词之间匹配并用正斜杠/替换反斜杠\。我试过了,它在正则表达式测试器https://regexr.com/474s0中工作正常,但是当我从基于Java的应用程序进行测试时却无法正常工作。收到此错误。

org.apache.oro.text.regex.MalformedPatternException:序列(?<...)无法识别

正则表达式已尝试: (?<=<(DocumentImagePath)>.*?)(\\)(?=.*<\/(DocumentImagePath)>)

示例:

<DocumentImagePath>95230-88\M0010002F.tif\test</DocumentImagePath> <DocumentImagePath>123-88\M0010002F.tif\test</DocumentImagePath> <DocumentImagePath>abc-88\M0010002F.tif\test</DocumentImagePath>

感谢您的帮助。

注意:我了解并非所有编译器都支持正面的外观,而是在寻找适合Java的正则表达式替代品。

1 个答案:

答案 0 :(得分:1)

您可以这样做(Java 9 +):

String sample = "<DocumentImagePath>95230-88\\M0010002F.tif\\test</DocumentImagePath>\r\n" +
                "95230-88\\M0010002F.tif\\test\r\n" +
                "<DocumentImagePath>123-88\\M0010002F.tif\\test</DocumentImagePath>\r\n" +
                "<DocumentImagePath>abc-88\\M0010002F.tif\\test</DocumentImagePath>\r\n";

String result = Pattern.compile("<DocumentImagePath>.*?</DocumentImagePath>")
                       .matcher(sample)
                       .replaceAll(r -> r.group().replace('\\', '/'));

System.out.println(result);

输出

<DocumentImagePath>95230-88/M0010002F.tif/test</DocumentImagePath>
95230-88\M0010002F.tif\test
<DocumentImagePath>123-88/M0010002F.tif/test</DocumentImagePath>
<DocumentImagePath>abc-88/M0010002F.tif/test</DocumentImagePath>

更新:对于Java 8和更低版本,请使用以下代码:

StringBuffer buf = new StringBuffer();
Matcher m = Pattern.compile("<DocumentImagePath>.*?</DocumentImagePath>").matcher(sample);
while (m.find())
    m.appendReplacement(buf, m.group().replace('\\', '/'));
String result = m.appendTail(buf).toString();