如何在java中正确地逃避这个正则表达式模式?

时间:2014-09-11 11:15:54

标签: java regex

这是我想要处理的输入。我想提取operation属性的值:

<h:outputLink value="#" id="temp_solution">
    <rich:componentContro
        for="panel"
        attachTo="temp_solution"
        operation="show"
        event="onclick"/>
</h:outputLink>

online regex tester的帮助下,我提出了以下正则表达式

(?<=operation=")(\w+)(?=")

为了更加动态,我将operation替换为%s,以便我可以将此模板用于不同的情况。但我遇到了一个问题,试图在一个小测试程序的帮助下测试我的“创造”:

public class Main {
  private static final String INPUT = "<h:outputLink value=\"#\" id=\"temp_solution\">\n"
      + "    <rich:componentControl \n"
      + "        for=\"panel\" \n"
      + "        attachTo=\"temp_solution\" \n"
      + "        operation=\"show\""
      + "        event=\"onclick\"/>  \n"
      + "</h:outputLink>";

  private static final String REGEX_TEMPLATE = "(?<=%s=\")(\\w+)(?=\")";

  public static void main(String[] args) throws IOException {
    final String  actualRegex = String.format(REGEX_TEMPLATE, "operation");    
    final Pattern pattern     = Pattern.compile(actualRegex);
    final Matcher matcher     = pattern.matcher(INPUT);

    System.out.println("Regex: " + pattern);     
    System.out.println(matcher.matches() ? matcher.group(0) : "Nothing found");
  }
}

输出:

Regex: (?<=operation=")(\w+)(?=")
Nothing found



甚至双重逃避我的代码中的正则表达式:

private static final String REGEX_TEMPLATE = "(?<=%s=\\\")(\\\\w+)(?=\\\")";

无效:

Regex: (?<=operation=\")(\\w+)(?=\")
Nothing found

请给我一些建议。

2 个答案:

答案 0 :(得分:5)

你的正则表达式没有任何问题。但是,它并不匹配整个输入,因此您无法使用matches()。将其更改为find(),它只会尝试查找匹配的子序列:

System.out.println(matcher.find() ? matcher.group(0) : "Nothing found");

答案 1 :(得分:1)

尝试使用这样的正则表达式:

(?<=operation=\")(\w+)

demo