Java支持条件前瞻

时间:2012-01-20 17:27:38

标签: java regex regex-lookarounds

在下面我们说邮政编码我试图从结果中排除33333- 我这样做:

String zip = "11111 22222 33333- 44444-4444";
String regex = "\\d{5}(?(?=-)-\\d{4})";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(zip);
while (matcher.find()) { 
   System.out.println(" Found: " + matcher.group());     
}

期待得到:

Found:  11111  
Found:  22222  
Found:  44444-4444

我正在尝试执行以下格式:
5位数字后跟一个 - 和4位数字。仅需要5个数字 - (连字符)

我得到例外:

Exception in thread "main" java.util.regex.PatternSyntaxException: Unknown inline modifier near index 7
\d{5}(?(?=-)(-\d{4}))
       ^
    at java.util.regex.Pattern.error(Unknown Source)
    at java.util.regex.Pattern.group0(Unknown Source)
    at java.util.regex.Pattern.sequence(Unknown Source)
    at java.util.regex.Pattern.expr(Unknown Source)
    at java.util.regex.Pattern.compile(Unknown Source)
    at java.util.regex.Pattern.<init>(Unknown Source)
    at java.util.regex.Pattern.compile(Unknown Source)

我没有正确使用条件前瞻吗?

4 个答案:

答案 0 :(得分:6)

要捕获除33333之外的所有数字,请使用以下代码:

String zip = "11111 22222 33333- 44444-4444";
String regex = "\\d{5}(?=(-\\d{4}|\\s|$))(-\\d{4})?";
Matcher m = Pattern.compile(regex).matcher(zip);
while(m.find())
    System.out.printf("Macthed: [%s]%n", m.group(1));

<强>输出:

Macthed: [11111]
Macthed: [22222]
Macthed: [44444-4444]

说明:此RegEx使用前瞻,它本身就像一个条件,这意味着匹配必须跟随的5位数字 - 和4位数字或空格或字符串结尾然后它是可选地匹配文本 - 和4位数。

原始RegEx导致异常的原因是因为您的RegEx ?:(?=-)部分存在语法错误。

答案 1 :(得分:0)

你在(?之后错过了一个冒号,即使用这个正则表达式(非Java-String):\d{5}(?:(?=-)-\d{4})

但是,这可能仍然无法产生您想要的结果。请发布一些示例输入和所需输出。

答案 2 :(得分:0)

我的问题对我来说有点不清楚。我想你在寻找:

String st = "11111 22222 33333- 44444-4444";
String pattern = "\\d+(- )";
String res  = st.replaceAll(pattern,"");
System.out.println(res);

输出= 11111 22222 44444-4444

答案 3 :(得分:0)

(\d{5}(?!-\s)(?:-\d{4})?)

因此:

String regex = "(\\d{5}(?!-\\s)(?:-\\d{4})?)";`