正则表达式匹配货币数字范围

时间:2013-10-03 16:43:30

标签: java regex

如何编写与-214748.00-214748214748.00的货币数字范围匹配的正则表达式?

我试过这个但没有工作。

^[-]?[0-9]{1,214748 }(?:\\.[0-9]{2})?$

2 个答案:

答案 0 :(得分:5)

NONONO。您正在使用错误的工具来完成工作。正则表达式只是一个文本处理工具。解释文本的含义是不好的。在识别需要处理的文本的语义时,这就是正则表达式不好的地方。

您应该使用简单的语言工具和操作员来完成这项工作。除此之外,如果您处理货币,请避免使用doublefloat。它们没有足够的精度来准确表示所有浮点数。请改用BigDecimal


警告:请不要将此问题用于此类问题:
注意:这不处理浮点数。

由于你坚持这么多,我已经提出了以下正则表达式,它适用于我测试过的一些输入。我想它对于给定范围内的任何整数值都可以正常工作:

"-?(\\d{1,5}|1\\d{5}|2(?:0\\d{4}|1(?:[0-3]\\d{3}|4(?:[0-6]\\d{2}|7(?:[0-3]\\d|4[0-8])))))"

-?表示负数的可选-

演示代码:

String str = "-?(\\d{1,5}|1\\d{5}|2(?:0\\d{4}|1(?:[0-3]\\d{3}|4(?:[0-6]\\d{2}|7(?:[0-3]\\d|4[0-8])))))";

System.out.println("214748".matches(str));  // true
System.out.println("214746".matches(str));  // true
System.out.println("2148".matches(str));    // true
System.out.println("-21448".matches(str));  // true
System.out.println("-214747".matches(str)); // true
System.out.println("214749".matches(str));  // false

正则表达式使用以下事实。对于范围[-214748, 214748]

  • 任何5个或更少的数字有效 - \\d{1,5}
  • 1开头的任何6位数字都有效 - 1\\d{5}
  • 对于以2开头的数字:
    • 0开头的其他5位数字有效 - 20\\d{4}
    • 如果2旁边的数字是1
      1. [0-3]开头的任何其他4位数字有效 - 21[0-3]\\d{3}
      2. 对于以4开头的任何其他4位数字:
        • [0-6]开头的数字有效 - 214[0-6]\d{2}
        • 如果4之后的数字是7,那么
          1. [0-3]开头的任何其他数字均有效 - 2147[0-3]\\d
          2. 如果7之后的数字为4,则[0-8]之后的范围4有效 - 21474[0-8]

答案 1 :(得分:1)

这是一个正在运行的正则表达式,可以满足您的要求:

^-?((([0-9]{1,5}|1[0-9]{5}|2(0[0-9]{4}|1([0-3][0-9]{3}|4([0-6][0-9]{2}|7([0-3][0-9]|4[0-7])))))([.][0-9]{2})?)|214748([.]00)?)$

这在很大程度上依赖于以下子正则表达式,它匹配0到214747的范围:

([0-9]{1,5}|1[0-9]{5}|2(0[0-9]{4}|1([0-3][0-9]{3}|4([0-6][0-9]{2}|7([0-3][0-9]|4[0-7])))))

为什么从0到214747而不是0到214748?因为这样做,所以更容易避免匹配214748.01到214748.99(+/-)的值。打破正则表达式,我们得到:

^ # match start of line
 -? # optional minus sign
  ( # match one of the following groups, this one:
   (
    ([0-9]{1,5}|1[0-9]{5}|2(0[0-9]{4}|1([0-3][0-9]{3}|4([0-6][0-9]{2}|7([0-3][0-9]|4[0-7])))))
    # the sub-regex above matches the range from 0 to 214747
    ([.][0-9]{2})? # this matches the optional two decimals
   ) 

   | # or this one:
   214748([.]00)? # 214748, with optional zeroes
  ) 
$ # match end of line

而且你有它,一个过于复杂的正则表达式,这是一个噩梦,更不用说保持。如果您需要更改范围,则需要大量工作。

我希望这种怪异能阻止使用正则表达式执行此任务。像其他人一样说并使用适当的工具处理它。如果正则表达式是必需的,请告诉他们这是一个可怕的想法并要求他们修复要求。