正则表达式匹配带或不带逗号和文本小数的数字

时间:2011-05-06 21:14:28

标签: regex

我正在尝试查找并替换正文中的所有数字。我找到了一些示例正则表达式,几乎解决了问题,但没有一个是完美的。我遇到的问题是我的文本中的数字可能有也可能没有小数和逗号。例如:

  

“5000磅的狐狸跳过99,999.99998713英尺的围栏。”

正则表达式应返回“5000”和“99,999.99998713”。示例我发现分解逗号上的数字或限制为两位小数。我开始理解正则表达式足以看出为什么有些例子仅限于两位小数,但我还没有学会如何克服它,还包括逗号以获得​​整个序列。

这是我的最新版本:

[0-9]+(\.[0-9][0-9]?)?

对于上述文字,会返回“5000”,“99,99”,“9.99”和“998713”。

10 个答案:

答案 0 :(得分:241)

编辑:由于这已经获得了很多观点,让我首先向每个人提供他们用Google搜索的内容:

#ALL THESE REQUIRE THE WHOLE STRING TO BE A NUMBER
#For numbers embedded in sentences, see discussion below

#### NUMBERS AND DECIMALS ONLY ####
#No commas allowed
#Pass: (1000.0), (001), (.001)
#Fail: (1,000.0)
^\d*\.?\d+$

#No commas allowed
#Can't start with "."
#Pass: (0.01)
#Fail: (.01)
^(\d+\.)?\d+$

#### CURRENCY ####
#No commas allowed
#"$" optional
#Can't start with "."
#Either 0 or 2 decimal digits
#Pass: ($1000), (1.00), ($0.11)
#Fail: ($1.0), (1.), ($1.000), ($.11)
^\$?\d+(\.\d{2})?$

#### COMMA-GROUPED ####
#Commas required between powers of 1,000
#Can't start with "."
#Pass: (1,000,000), (0.001)
#Fail: (1000000), (1,00,00,00), (.001)
^\d{1,3}(,\d{3})*(\.\d+)?$

#Commas required
#Cannot be empty
#Pass: (1,000.100), (.001)
#Fail: (1000), ()
^(?=.)(\d{1,3}(,\d{3})*)?(\.\d+)?$

#Commas optional as long as they're consistent
#Can't start with "."
#Pass: (1,000,000), (1000000)
#Fail: (10000,000), (1,00,00)
^(\d+|\d{1,3}(,\d{3})*)(\.\d+)?$

#### LEADING AND TRAILING ZEROES ####
#No commas allowed
#Can't start with "."
#No leading zeroes in integer part
#Pass: (1.00), (0.00)
#Fail: (001)
^([1-9]\d*|0)(\.\d+)?$

#No commas allowed
#Can't start with "."
#No trailing zeroes in decimal part
#Pass: (1), (0.1)
#Fail: (1.00), (0.1000)
^\d+(\.\d*[1-9])?$

现在已经开始了,以下大部分内容都是对复杂正则表达式如果能够巧妙地使用它以及为什么要寻找替代方案的评论。阅读需要您自担风险。


这是一项非常常见的任务,但到目前为止我在此处看到的所有答案都会接受与您的数字格式不符的输入,例如,1119,9,9甚至{{1 }}。即使数字嵌入在其他文本中,这也很容易修复。恕我直言,任何未能拉1,234.56和1234- 而只有那些数字 -out .,,.是错误的答案。

首先,如果您不需要在一个正则表达式中执行此操作,请不要这样做。即使它们未嵌入到其他文本中,也难以维护两种不同数字格式的单个正则表达式。你应该做的是将整个事物分成空白,然后在结果上运行两到三个较小的正则表达式。如果这不是您的选择,请继续阅读。

基本模式

考虑到你给出的例子,这是一个简单的正则表达式,允许abc22 1,234.56 9.9.9.9 def 1234格式的几乎任何整数或小数,并阻止其他所有:

0000

以下是需要^\d*\.?\d+$ 格式的内容:

0,000

将它们放在一起,只要它们一致,逗号就成为可选项:

^\d{1,3}(,\d{3})*(\.\d+)?$

嵌入数字

上述模式要求整个输入为数字。您正在寻找嵌入文本中的数字,因此您必须放松该部分。另一方面,你不希望它看到^(\d*\.?\d+|\d{1,3}(,\d{3})*(\.\d+)?)$ 并认为它找到了数字22.如果你正在使用具有lookbehind支持的东西(比如.NET),这很容易:替换{{1 } catch22^ (?<!\S),你很高兴:

$

如果您正在使用JavaScript或Ruby等,事情开始变得更复杂:

(?!\S)

你必须使用捕获组;没有外观支持,我想不出另类。您想要的数字将在第1组(假设整个匹配为第0组)。

验证和更复杂的规则

我认为这涵盖了您的问题,所以如果您只需要,请立即停止阅读。如果你想变得更有魅力,事情会变得非常复杂。根据您的具体情况,您可能希望阻止以下任何或所有情况:

  • 空输入
  • 前导零(例如000123)
  • 尾随零(例如1.2340000)
  • 以小数点开头的小数(例如.001而不是0.001)

只是为了它的地狱,我们假设您要阻止前3个,但允许最后一个。你该怎么办?我会告诉你应该做什么,你应该为每个规则使用不同的正则表达式,并逐步缩小你的匹配范围。但是为了挑战,这里是你如何以一种巨大的模式做到这一切:

(?<!\S)(\d*\.?\d+|\d{1,3}(,\d{3})*(\.\d+)?)(?!\S)

这就是它的含义:

(?:^|\s)(\d*\.?\d+|\d{1,3}(?:,\d{3})*(?:\.\d+)?)(?!\S)

在这里测试:http://rextester.com/YPG96786

这将允许以下内容:

(?<!\S)(?=.)(0|([1-9](\d*|\d{0,2}(,\d{3})*)))?(\.\d*[1-9])?(?!\S)

它会阻止像:

(?<!\S) to (?!\S) #The whole match must be surrounded by either whitespace or line boundaries. So if you see something bogus like :;:9.:, ignore the 9.
(?=.)             #The whole thing can't be blank.

(                    #Rules for the integer part:
  0                  #1. The integer part could just be 0...
  |                  #
  [1-9]              #   ...otherwise, it can't have leading zeroes.
  (                  #
    \d*              #2. It could use no commas at all...
    |                #
    \d{0,2}(,\d{3})* #   ...or it could be comma-separated groups of 3 digits each.
  )                  # 
)?                   #3. Or there could be no integer part at all.

(       #Rules for the decimal part:
  \.    #1. It must start with a decimal point...
  \d*   #2. ...followed by a string of numeric digits only.
  [1-9] #3. It can't be just the decimal point, and it can't end in 0.
)?      #4. The whole decimal part is also optional. Remember, we checked at the beginning to make sure the whole thing wasn't blank.

有几种方法可以使这个正则表达式更简单,更短,但要明白,更改模式会放松它认为的数字。

由于许多正则表达式引擎(例如JavaScript和Ruby)不支持负面的lookbehind,因此正确执行此操作的唯一方法是使用捕获组:

100,000
999.999
90.0009
1,000,023.999
0.111
.111
0

您正在寻找的数字将位于捕获组1中。

在这里测试:http://rubular.com/r/3HCSkndzhT

最后一个注释

显然,这是一个庞大,复杂,难以理解的正则表达式。我喜欢这个挑战,但你应该考虑你是否真的想在生产环境中使用它。你可以在一步中完成所有事情,而不是一两步:一个正则表达式来捕获任何东西那个可能是一个数字,然后另一个用来清除不是一个数字。或者您可以进行一些基本处理,然后使用您的语言的内置数字解析功能。你的选择。

答案 1 :(得分:9)

前几天,我参与了the problem of removing trailing zeros from the string of a number

在这个问题的连续性中,我觉得这个问题很有意思,因为它将问题扩大到包含逗号的数字。

我已经采用了我在上一个问题中编写的正则表达式模式,并且我对其进行了改进,以便它可以用逗号处理数字作为此问题的答案。

我的热情和对正则表达的喜爱让我感到震惊。我不知道结果是否完全符合Michael Prescott表达的需要。我很想知道我的正则表达式中过多或缺乏的点,并纠正它以使其更适合你。

现在,在这个正则表达式的长期工作之后,我在大脑中有一定的重量,所以我不够新鲜,不能给出很多解释。如果积分不明确,如果有人对此感兴趣,请问我。

构建正则表达式是为了能够检测以科学记数法 2E10 或甚至 5,22,454.12E-00.0478 表示的数字,从而删除两部分中不必要的零这些数字也是如此。如果指数等于零,则修改数字,以便不再有指数。

我在模式中添加了一些验证,以便某些特定情况不匹配,例如 '12 ..57'将不匹配。但是在',111'中,字符串'111'匹配,因为前面的逗号被认为是逗号不在数字中而是逗号。

我认为应该改进逗号的管理,因为在我看来,印度编号中的逗号之间只有2位数。我推测

是不会很难纠正的

以下是演示我的正则表达式如何工作的代码。有两种功能,如果有人希望数字'。1245''0.1245'中进行转换。如果某些数字字符串的错误或不需要的匹配或不匹配仍然存在,我不会感到惊讶;那么我想了解这些案例,以了解和纠正这些不足。

我为这个用Python编写的代码道歉,但正则表达式是跨语言的,我认为每个人都有能力取消reex的模式

import re

regx = re.compile('(?<![\d.])(?!\.\.)(?<![\d.][eE][+-])(?<![\d.][eE])(?<!\d[.,])'
                  '' #---------------------------------
                  '([+-]?)'
                  '(?![\d,]*?\.[\d,]*?\.[\d,]*?)'
                  '(?:0|,(?=0)|(?<!\d),)*'
                  '(?:'
                  '((?:\d(?!\.[1-9])|,(?=\d))+)[.,]?'
                  '|\.(0)'
                  '|((?<!\.)\.\d+?)'
                  '|([\d,]+\.\d+?))'
                  '0*'
                  '' #---------------------------------
                  '(?:'
                  '([eE][+-]?)(?:0|,(?=0))*'
                  '(?:'
                  '(?!0+(?=\D|\Z))((?:\d(?!\.[1-9])|,(?=\d))+)[.,]?'
                  '|((?<!\.)\.(?!0+(?=\D|\Z))\d+?)'
                  '|([\d,]+\.(?!0+(?=\D|\Z))\d+?))'
                  '0*'
                  ')?'
                  '' #---------------------------------
                  '(?![.,]?\d)')


def dzs_numbs(x,regx = regx): # ds = detect and zeros-shave
    if not regx.findall(x):
        yield ('No match,', 'No catched string,', 'No groups.')
    for mat in regx.finditer(x):
        yield (mat.group(), ''.join(mat.groups('')), mat.groups(''))

def dzs_numbs2(x,regx = regx): # ds = detect and zeros-shave
    if not regx.findall(x):
        yield ('No match,', 'No catched string,', 'No groups.')
    for mat in regx.finditer(x):
        yield (mat.group(),
               ''.join(('0' if n.startswith('.') else '')+n for n in mat.groups('')),
               mat.groups(''))

NS = ['  23456000and23456000. or23456000.000  00023456000 s000023456000.  000023456000.000 ',
      'arf 10000 sea10000.+10000.000  00010000-00010000. kant00010000.000 ',
      '  24:  24,  24.   24.000  24.000,   00024r 00024. blue 00024.000  ',
      '  8zoom8.  8.000  0008  0008. and0008.000  ',
      '  0   00000M0. = 000.  0.0  0.000    000.0   000.000   .000000   .0   ',
      '  .0000023456    .0000023456000   '
      '  .0005872    .0005872000   .00503   .00503000   ',
      '  .068    .0680000   .8   .8000  .123456123456    .123456123456000    ',
      '  .657   .657000   .45    .4500000   .7    .70000  0.0000023230000   000.0000023230000   ',
      '  0.0081000    0000.0081000  0.059000   0000.059000     ',
      '  0.78987400000 snow  00000.78987400000  0.4400000   00000.4400000   ',
      '  -0.5000  -0000.5000   0.90   000.90   0.7   000.7   ',
      '  2.6    00002.6   00002.60000  4.71   0004.71    0004.7100   ',
      '  23.49   00023.49   00023.490000  103.45   0000103.45   0000103.45000    ',
      '  10003.45067   000010003.45067   000010003.4506700 ',
      '  +15000.0012   +000015000.0012   +000015000.0012000    ',
      '  78000.89   000078000.89   000078000.89000    ',
      '  .0457e10   .0457000e10   00000.0457000e10  ',
      '   258e8   2580000e4   0000000002580000e4   ',
      '  0.782e10   0000.782e10   0000.7820000e10  ',
      '  1.23E2   0001.23E2  0001.2300000E2   ',
      '  432e-102  0000432e-102   004320000e-106   ',
      '  1.46e10and0001.46e10  0001.4600000e10   ',
      '  1.077e-300  0001.077e-300  0001.077000e-300   ',
      '  1.069e10   0001.069e10   0001.069000e10   ',
      '  105040.03e10  000105040.03e10  105040.0300e10    ',
      '  +286E000024.487900  -78.4500e.14500   .0140E789.  ',
      '  081,12.40E07,95.0120     0045,78,123.03500e-0.00  ',
      '  0096,78,473.0380e-0.    0008,78,373.066000E0.    0004512300.E0000  ',
      '  ..18000  25..00 36...77   2..8  ',
      '  3.8..9    .12500.     12.51.400  ',
      '  00099,111.8713000   -0012,45,83,987.26+0.000,099,88,44.or00,00,00.00must',
      '  00099,44,and   0000,099,88,44.bom',
      '00,000,00.587000  77,98,23,45.,  this,that ',
      '  ,111  145.20  +9,9,9  0012800  .,,.  1  100,000 ',
      '1,1,1.111  000,001.111   -999.  0.  111.110000  1.1.1.111  9.909,888']


for ch in NS:
    print 'string: '+repr(ch)
    for strmatch, modified, the_groups in dzs_numbs2(ch):
        print strmatch.rjust(20),'',modified,'',the_groups
    print

结果

string: '  23456000and23456000. or23456000.000  00023456000 s000023456000.  000023456000.000 '
            23456000  23456000  ('', '23456000', '', '', '', '', '', '', '')
           23456000.  23456000  ('', '23456000', '', '', '', '', '', '', '')
        23456000.000  23456000  ('', '23456000', '', '', '', '', '', '', '')
         00023456000  23456000  ('', '23456000', '', '', '', '', '', '', '')
       000023456000.  23456000  ('', '23456000', '', '', '', '', '', '', '')
    000023456000.000  23456000  ('', '23456000', '', '', '', '', '', '', '')

string: 'arf 10000 sea10000.+10000.000  00010000-00010000. kant00010000.000 '
               10000  10000  ('', '10000', '', '', '', '', '', '', '')
              10000.  10000  ('', '10000', '', '', '', '', '', '', '')
           10000.000  10000  ('', '10000', '', '', '', '', '', '', '')
            00010000  10000  ('', '10000', '', '', '', '', '', '', '')
           00010000.  10000  ('', '10000', '', '', '', '', '', '', '')
        00010000.000  10000  ('', '10000', '', '', '', '', '', '', '')

string: '  24:  24,  24.   24.000  24.000,   00024r 00024. blue 00024.000  '
                  24  24  ('', '24', '', '', '', '', '', '', '')
                 24,  24  ('', '24', '', '', '', '', '', '', '')
                 24.  24  ('', '24', '', '', '', '', '', '', '')
              24.000  24  ('', '24', '', '', '', '', '', '', '')
              24.000  24  ('', '24', '', '', '', '', '', '', '')
               00024  24  ('', '24', '', '', '', '', '', '', '')
              00024.  24  ('', '24', '', '', '', '', '', '', '')
           00024.000  24  ('', '24', '', '', '', '', '', '', '')

string: '  8zoom8.  8.000  0008  0008. and0008.000  '
                   8  8  ('', '8', '', '', '', '', '', '', '')
                  8.  8  ('', '8', '', '', '', '', '', '', '')
               8.000  8  ('', '8', '', '', '', '', '', '', '')
                0008  8  ('', '8', '', '', '', '', '', '', '')
               0008.  8  ('', '8', '', '', '', '', '', '', '')
            0008.000  8  ('', '8', '', '', '', '', '', '', '')

string: '  0   00000M0. = 000.  0.0  0.000    000.0   000.000   .000000   .0   '
                   0  0  ('', '0', '', '', '', '', '', '', '')
               00000  0  ('', '0', '', '', '', '', '', '', '')
                  0.  0  ('', '0', '', '', '', '', '', '', '')
                000.  0  ('', '0', '', '', '', '', '', '', '')
                 0.0  0  ('', '', '0', '', '', '', '', '', '')
               0.000  0  ('', '', '0', '', '', '', '', '', '')
               000.0  0  ('', '', '0', '', '', '', '', '', '')
             000.000  0  ('', '', '0', '', '', '', '', '', '')
             .000000  0  ('', '', '0', '', '', '', '', '', '')
                  .0  0  ('', '', '0', '', '', '', '', '', '')

string: '  .0000023456    .0000023456000     .0005872    .0005872000   .00503   .00503000   '
         .0000023456  0.0000023456  ('', '', '', '.0000023456', '', '', '', '', '')
      .0000023456000  0.0000023456  ('', '', '', '.0000023456', '', '', '', '', '')
            .0005872  0.0005872  ('', '', '', '.0005872', '', '', '', '', '')
         .0005872000  0.0005872  ('', '', '', '.0005872', '', '', '', '', '')
              .00503  0.00503  ('', '', '', '.00503', '', '', '', '', '')
           .00503000  0.00503  ('', '', '', '.00503', '', '', '', '', '')

string: '  .068    .0680000   .8   .8000  .123456123456    .123456123456000    '
                .068  0.068  ('', '', '', '.068', '', '', '', '', '')
            .0680000  0.068  ('', '', '', '.068', '', '', '', '', '')
                  .8  0.8  ('', '', '', '.8', '', '', '', '', '')
               .8000  0.8  ('', '', '', '.8', '', '', '', '', '')
       .123456123456  0.123456123456  ('', '', '', '.123456123456', '', '', '', '', '')
    .123456123456000  0.123456123456  ('', '', '', '.123456123456', '', '', '', '', '')

string: '  .657   .657000   .45    .4500000   .7    .70000  0.0000023230000   000.0000023230000   '
                .657  0.657  ('', '', '', '.657', '', '', '', '', '')
             .657000  0.657  ('', '', '', '.657', '', '', '', '', '')
                 .45  0.45  ('', '', '', '.45', '', '', '', '', '')
            .4500000  0.45  ('', '', '', '.45', '', '', '', '', '')
                  .7  0.7  ('', '', '', '.7', '', '', '', '', '')
              .70000  0.7  ('', '', '', '.7', '', '', '', '', '')
     0.0000023230000  0.000002323  ('', '', '', '.000002323', '', '', '', '', '')
   000.0000023230000  0.000002323  ('', '', '', '.000002323', '', '', '', '', '')

string: '  0.0081000    0000.0081000  0.059000   0000.059000     '
           0.0081000  0.0081  ('', '', '', '.0081', '', '', '', '', '')
        0000.0081000  0.0081  ('', '', '', '.0081', '', '', '', '', '')
            0.059000  0.059  ('', '', '', '.059', '', '', '', '', '')
         0000.059000  0.059  ('', '', '', '.059', '', '', '', '', '')

string: '  0.78987400000 snow  00000.78987400000  0.4400000   00000.4400000   '
       0.78987400000  0.789874  ('', '', '', '.789874', '', '', '', '', '')
   00000.78987400000  0.789874  ('', '', '', '.789874', '', '', '', '', '')
           0.4400000  0.44  ('', '', '', '.44', '', '', '', '', '')
       00000.4400000  0.44  ('', '', '', '.44', '', '', '', '', '')

string: '  -0.5000  -0000.5000   0.90   000.90   0.7   000.7   '
             -0.5000  -0.5  ('-', '', '', '.5', '', '', '', '', '')
          -0000.5000  -0.5  ('-', '', '', '.5', '', '', '', '', '')
                0.90  0.9  ('', '', '', '.9', '', '', '', '', '')
              000.90  0.9  ('', '', '', '.9', '', '', '', '', '')
                 0.7  0.7  ('', '', '', '.7', '', '', '', '', '')
               000.7  0.7  ('', '', '', '.7', '', '', '', '', '')

string: '  2.6    00002.6   00002.60000  4.71   0004.71    0004.7100   '
                 2.6  2.6  ('', '', '', '', '2.6', '', '', '', '')
             00002.6  2.6  ('', '', '', '', '2.6', '', '', '', '')
         00002.60000  2.6  ('', '', '', '', '2.6', '', '', '', '')
                4.71  4.71  ('', '', '', '', '4.71', '', '', '', '')
             0004.71  4.71  ('', '', '', '', '4.71', '', '', '', '')
           0004.7100  4.71  ('', '', '', '', '4.71', '', '', '', '')

string: '  23.49   00023.49   00023.490000  103.45   0000103.45   0000103.45000    '
               23.49  23.49  ('', '', '', '', '23.49', '', '', '', '')
            00023.49  23.49  ('', '', '', '', '23.49', '', '', '', '')
        00023.490000  23.49  ('', '', '', '', '23.49', '', '', '', '')
              103.45  103.45  ('', '', '', '', '103.45', '', '', '', '')
          0000103.45  103.45  ('', '', '', '', '103.45', '', '', '', '')
       0000103.45000  103.45  ('', '', '', '', '103.45', '', '', '', '')

string: '  10003.45067   000010003.45067   000010003.4506700 '
         10003.45067  10003.45067  ('', '', '', '', '10003.45067', '', '', '', '')
     000010003.45067  10003.45067  ('', '', '', '', '10003.45067', '', '', '', '')
   000010003.4506700  10003.45067  ('', '', '', '', '10003.45067', '', '', '', '')

string: '  +15000.0012   +000015000.0012   +000015000.0012000    '
         +15000.0012  +15000.0012  ('+', '', '', '', '15000.0012', '', '', '', '')
     +000015000.0012  +15000.0012  ('+', '', '', '', '15000.0012', '', '', '', '')
  +000015000.0012000  +15000.0012  ('+', '', '', '', '15000.0012', '', '', '', '')

string: '  78000.89   000078000.89   000078000.89000    '
            78000.89  78000.89  ('', '', '', '', '78000.89', '', '', '', '')
        000078000.89  78000.89  ('', '', '', '', '78000.89', '', '', '', '')
     000078000.89000  78000.89  ('', '', '', '', '78000.89', '', '', '', '')

string: '  .0457e10   .0457000e10   00000.0457000e10  '
            .0457e10  0.0457e10  ('', '', '', '.0457', '', 'e', '10', '', '')
         .0457000e10  0.0457e10  ('', '', '', '.0457', '', 'e', '10', '', '')
    00000.0457000e10  0.0457e10  ('', '', '', '.0457', '', 'e', '10', '', '')

string: '   258e8   2580000e4   0000000002580000e4   '
               258e8  258e8  ('', '258', '', '', '', 'e', '8', '', '')
           2580000e4  2580000e4  ('', '2580000', '', '', '', 'e', '4', '', '')
  0000000002580000e4  2580000e4  ('', '2580000', '', '', '', 'e', '4', '', '')

string: '  0.782e10   0000.782e10   0000.7820000e10  '
            0.782e10  0.782e10  ('', '', '', '.782', '', 'e', '10', '', '')
         0000.782e10  0.782e10  ('', '', '', '.782', '', 'e', '10', '', '')
     0000.7820000e10  0.782e10  ('', '', '', '.782', '', 'e', '10', '', '')

string: '  1.23E2   0001.23E2  0001.2300000E2   '
              1.23E2  1.23E2  ('', '', '', '', '1.23', 'E', '2', '', '')
           0001.23E2  1.23E2  ('', '', '', '', '1.23', 'E', '2', '', '')
      0001.2300000E2  1.23E2  ('', '', '', '', '1.23', 'E', '2', '', '')

string: '  432e-102  0000432e-102   004320000e-106   '
            432e-102  432e-102  ('', '432', '', '', '', 'e-', '102', '', '')
        0000432e-102  432e-102  ('', '432', '', '', '', 'e-', '102', '', '')
      004320000e-106  4320000e-106  ('', '4320000', '', '', '', 'e-', '106', '', '')

string: '  1.46e10and0001.46e10  0001.4600000e10   '
             1.46e10  1.46e10  ('', '', '', '', '1.46', 'e', '10', '', '')
          0001.46e10  1.46e10  ('', '', '', '', '1.46', 'e', '10', '', '')
     0001.4600000e10  1.46e10  ('', '', '', '', '1.46', 'e', '10', '', '')

string: '  1.077e-300  0001.077e-300  0001.077000e-300   '
          1.077e-300  1.077e-300  ('', '', '', '', '1.077', 'e-', '300', '', '')
       0001.077e-300  1.077e-300  ('', '', '', '', '1.077', 'e-', '300', '', '')
    0001.077000e-300  1.077e-300  ('', '', '', '', '1.077', 'e-', '300', '', '')

string: '  1.069e10   0001.069e10   0001.069000e10   '
            1.069e10  1.069e10  ('', '', '', '', '1.069', 'e', '10', '', '')
         0001.069e10  1.069e10  ('', '', '', '', '1.069', 'e', '10', '', '')
      0001.069000e10  1.069e10  ('', '', '', '', '1.069', 'e', '10', '', '')

string: '  105040.03e10  000105040.03e10  105040.0300e10    '
        105040.03e10  105040.03e10  ('', '', '', '', '105040.03', 'e', '10', '', '')
     000105040.03e10  105040.03e10  ('', '', '', '', '105040.03', 'e', '10', '', '')
      105040.0300e10  105040.03e10  ('', '', '', '', '105040.03', 'e', '10', '', '')

string: '  +286E000024.487900  -78.4500e.14500   .0140E789.  '
  +286E000024.487900  +286E24.4879  ('+', '286', '', '', '', 'E', '', '', '24.4879')
     -78.4500e.14500  -78.45e0.145  ('-', '', '', '', '78.45', 'e', '', '.145', '')
          .0140E789.  0.014E789  ('', '', '', '.014', '', 'E', '789', '', '')

string: '  081,12.40E07,95.0120     0045,78,123.03500e-0.00  '
081,12.40E07,95.0120  81,12.4E7,95.012  ('', '', '', '', '81,12.4', 'E', '', '', '7,95.012')
   0045,78,123.03500  45,78,123.035  ('', '', '', '', '45,78,123.035', '', '', '', '')

string: '  0096,78,473.0380e-0.    0008,78,373.066000E0.    0004512300.E0000  '
    0096,78,473.0380  96,78,473.038  ('', '', '', '', '96,78,473.038', '', '', '', '')
  0008,78,373.066000  8,78,373.066  ('', '', '', '', '8,78,373.066', '', '', '', '')
         0004512300.  4512300  ('', '4512300', '', '', '', '', '', '', '')

string: '  ..18000  25..00 36...77   2..8  '
           No match,  No catched string,  No groups.

string: '  3.8..9    .12500.     12.51.400  '
           No match,  No catched string,  No groups.

string: '  00099,111.8713000   -0012,45,83,987.26+0.000,099,88,44.or00,00,00.00must'
   00099,111.8713000  99,111.8713  ('', '', '', '', '99,111.8713', '', '', '', '')
  -0012,45,83,987.26  -12,45,83,987.26  ('-', '', '', '', '12,45,83,987.26', '', '', '', '')
         00,00,00.00  0  ('', '', '0', '', '', '', '', '', '')

string: '  00099,44,and   0000,099,88,44.bom'
           00099,44,  99,44  ('', '99,44', '', '', '', '', '', '', '')
     0000,099,88,44.  99,88,44  ('', '99,88,44', '', '', '', '', '', '', '')

string: '00,000,00.587000  77,98,23,45.,  this,that '
    00,000,00.587000  0.587  ('', '', '', '.587', '', '', '', '', '')
        77,98,23,45.  77,98,23,45  ('', '77,98,23,45', '', '', '', '', '', '', '')

string: '  ,111  145.20  +9,9,9  0012800  .,,.  1  100,000 '
                ,111  111  ('', '111', '', '', '', '', '', '', '')
              145.20  145.2  ('', '', '', '', '145.2', '', '', '', '')
              +9,9,9  +9,9,9  ('+', '9,9,9', '', '', '', '', '', '', '')
             0012800  12800  ('', '12800', '', '', '', '', '', '', '')
                   1  1  ('', '1', '', '', '', '', '', '', '')
             100,000  100,000  ('', '100,000', '', '', '', '', '', '', '')

string: '1,1,1.111  000,001.111   -999.  0.  111.110000  1.1.1.111  9.909,888'
           1,1,1.111  1,1,1.111  ('', '', '', '', '1,1,1.111', '', '', '', '')
         000,001.111  1.111  ('', '', '', '', '1.111', '', '', '', '')
               -999.  -999  ('-', '999', '', '', '', '', '', '', '')
                  0.  0  ('', '0', '', '', '', '', '', '', '')
          111.110000  111.11  ('', '', '', '', '111.11', '', '', '', '')

答案 2 :(得分:5)

下面的正则表达式将匹配您示例中的两个数字。

\b\d[\d,.]*\b

它将返回5000和99,999.99998713 - 符合您的要求。

答案 3 :(得分:3)

根据要求获得一定的自由,你正在寻找

\d+([\d,]?\d)*(\.\d+)?

但请注意这将匹配,例如11,11,1

答案 4 :(得分:3)

\d+(,\d+)*(\.\d+)?

这假设在任何逗号或小数之前或之后总是至少有一个数字,并且还假定最多有一个小数,并且所有逗号都在小数之前。

答案 5 :(得分:2)

这个正则表达式:

(\d{1,3},\d{3}(,\d{3})*)(\.\d*)?|\d+\.?\d*

匹配字符串中的每个数字:

1 1.0 0.1 1.001 1,000 1,000,000 1000.1 1,000.1 1,323,444,000 1,999 1,222,455,666.0 1,244

答案 6 :(得分:1)

这是另一种结构,它以最简单的数字格式开始,然后以非重叠的方式逐步添加更复杂的数字格式:

Java regep:

(\d)|([1-9]\d+)|(\.\d+)|(\d\.\d*)|([1-9]\d+\.\d*)|([1-9]\d{0,2}(,\d{3})+(\.\d*)?)

作为一个Java字符串(注意要转义为\和。之后需要的额外\因为\和。在自己的regexp中有特殊含义):

String myregexp="(\\d)|([1-9]\\d+)|(\\.\\d+)|(\\d\\.\\d*)|([1-9]\\d+\\.\\d*)|([1-9]\\d{0,2}(,\\d{3})+(\\.\\d*)?)";   

说明:

  1. 此正则表达式的形式为A | B | C | D | E | F,其中A,B,C,D,E,F本身是不重叠的正则表达式。一般来说,我发现从最简单的匹配开始,A更容易。 如果A错过了你想要的匹配,那么创建一个B,它是A的一个小修改,包括你想要的更多。然后,基于B,创建一个可以捕获更多的C等等。我还发现创建不重叠的正则表达式更容易;使用与OR连接的20个简单的非重叠正则表达式而不是具有更复杂匹配的几个正则表达式更容易理解正则表达式。但是,各自为自己!

  2. A是(\ d)并且恰好匹配0,1,2,3,4,5,6,7,8,9中的一个,这可能更简单!

    < / LI>
  3. B是([1-9] \ d +)并且仅匹配2位或更多位的数字,第一位不包括0。 B恰好匹配10,11,12中的一个,... B不重叠A但是A的小修改。

  4. C是(。\ d +)并且只匹配小数后跟一个或多个数字。 C恰好匹配.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .00 .01 .01。02 ...中的一个。 .23000 ... C允许我更喜欢右边的尾随色情:如果这是测量数据,则尾随零的数量表示精确度。如果你不想要右边的尾随零,将(。\ d +)更改为(。\ d * [1-9]),但这也排除.0我认为应该允许。 C也是A的一个小修改。

  5. D是(\ d。\ d *),它是A加小数,右边是尾随零。 D只匹配一个数字,后跟一个小数,后跟零个或多个数字。 D匹配0. 0.0 0.1 0.2 .... 0.01000 ... 9。 9.0 9.1..0.0230000 .... 9.9999999999 ...如果要排除&#34; 0。&#34;然后将D更改为(\ d。\ d +)。如果要在右侧排除尾随零,请将D更改为(\ d。\ d * [1-9]),但这不包括我认为应该包括的2.0。 D不与A,B或C重叠。

  6. E是([1-9] \ d +。\ d *),它是B加小数,右边是尾随零。例如,如果要排除&#34; 13。&#34;,则将E更改为([1-9] \ d +。\ d +)。 E不与A,B,C或D重叠.E匹配10. 10.0 10.0100 .... 99.9999999999 ...尾随零可以按照4.和5处理。

  7. F是([1-9] \ d {0,2}(,\ d {3})+(。\ d *)?)并且只匹配带逗号和可能小数的数字,允许尾随零在右边。第一组([1-9] \ d {0,2})匹配非零数字,后跟零,一个或两个以上的数字。第二组(,\ d {3})+匹配一个4个字符的组(逗号后跟正好三个数字),这个组可以匹配一次或多次(没有匹配意味着没有逗号!)。最后,(。\ d *)?什么都不匹配,或匹配。单独或匹配小数。后跟任意数字的数字,可能没有。同样,要排除&#34; 1,111。&#34;之类的内容,请将(。\ d *)更改为(。\ d +)。尾随零可以按照4.或5进行处理.F不与A,B,C,D或E重叠。我无法想到F的更容易的正则表达式。

  8. 如果您有兴趣,请告诉我,我可以根据需要进行编辑,以根据需要处理右侧的尾随零。

    以下是匹配regexp和不匹配的内容:

    0
    1
    02 <- invalid
    20
    22
    003 <- invalid
    030 <- invalid
    300
    033 <- invalid
    303
    330
    333
    0004 <- invalid
    0040 <- invalid
    0400 <- invalid
    4000
    0044 <- invalid
    0404 <- invalid
    0440 <- invalid
    4004
    4040
    4400
    0444 <- invalid
    4044
    4404
    4440
    4444
    00005 <- invalid
    00050 <- invalid
    00500 <- invalid
    05000 <- invalid
    50000
    00055 <- invalid
    00505 <- invalid
    00550 <- invalid
    05050 <- invalid
    05500 <- invalid
    50500
    55000
    00555 <- invalid
    05055 <- invalid
    05505 <- invalid
    05550 <- invalid
    50550
    55050
    55500
    . <- invalid
    .. <- invalid
    .0
    0.
    .1
    1.
    .00
    0.0
    00. <- invalid
    .02
    0.2
    02. <- invalid
    .20
    2.0
    20.
    .22
    2.2
    22.
    .000
    0.00
    00.0 <- invalid
    000. <- invalid
    .003
    0.03
    00.3 <- invalid
    003. <- invalid
    .030
    0.30
    03.0 <- invalid
    030. <- invalid
    .033
    0.33
    03.3 <- invalid
    033. <- invalid
    .303
    3.03
    30.3
    303.
    .333
    3.33
    33.3
    333.
    .0000
    0.000
    00.00 <- invalid
    000.0 <- invalid
    0000. <- invalid
    .0004
    0.0004
    00.04 <- invalid
    000.4 <- invalid
    0004. <- invalid
    .0044
    0.044
    00.44 <- invalid
    004.4 <- invalid
    0044. <- invalid
    .0404
    0.404
    04.04 <- invalid
    040.4 <- invalid
    0404. <- invalid
    .0444
    0.444
    04.44 <- invalid
    044.4 <- invalid
    0444. <- invalid
    .4444
    4.444
    44.44
    444.4
    4444.
    .00000
    0.0000
    00.000 <- invalid
    000.00 <- invalid
    0000.0 <- invalid
    00000. <- invalid
    .00005
    0.0005
    00.005 <- invalid
    000.05 <- invalid
    0000.5 <- invalid
    00005. <- invalid
    .00055
    0.0055
    00.055 <- invalid
    000.55 <- invalid
    0005.5 <- invalid
    00055. <- invalid
    .00505
    0.0505
    00.505 <- invalid
    005.05 <- invalid
    0050.5 <- invalid
    00505. <- invalid
    .00550
    0.0550
    00.550 <- invalid
    005.50 <- invalid
    0055.0 <- invalid
    00550. <- invalid
    .05050
    0.5050
    05.050 <- invalid
    050.50 <- invalid
    0505.0 <- invalid
    05050. <- invalid
    .05500
    0.5500
    05.500 <- invalid
    055.00 <- invalid
    0550.0 <- invalid
    05500. <- invalid
    .50500
    5.0500
    50.500
    505.00
    5050.0
    50500.
    .55000
    5.5000
    55.000
    550.00
    5500.0
    55000.
    .00555
    0.0555
    00.555 <- invalid
    005.55 <- invalid
    0055.5 <- invalid
    00555. <- invalid
    .05055
    0.5055
    05.055 <- invalid
    050.55 <- invalid
    0505.5 <- invalid
    05055. <- invalid
    .05505
    0.5505
    05.505 <- invalid
    055.05 <- invalid
    0550.5 <- invalid
    05505. <- invalid
    .05550
    0.5550
    05.550 <- invalid
    055.50 <- invalid
    0555.0 <- invalid
    05550. <- invalid
    .50550
    5.0550
    50.550
    505.50
    5055.0
    50550.
    .55050
    5.5050
    55.050
    550.50
    5505.0
    55050.
    .55500
    5.5500
    55.500
    555.00
    5550.0
    55500.
    .05555
    0.5555
    05.555 <- invalid
    055.55 <- invalid
    0555.5 <- invalid
    05555. <- invalid
    .50555
    5.0555
    50.555
    505.55
    5055.5
    50555.
    .55055
    5.5055
    55.055
    550.55
    5505.5
    55055.
    .55505
    5.5505
    55.505
    555.05
    5550.5
    55505.
    .55550
    5.5550
    55.550
    555.50
    5555.0
    55550.
    .55555
    5.5555
    55.555
    555.55
    5555.5
    55555.
    , <- invalid
    ,, <- invalid
    1, <- invalid
    ,1 <- invalid
    22, <- invalid
    2,2 <- invalid
    ,22 <- invalid
    2,2, <- invalid
    2,2, <- invalid
    ,22, <- invalid
    333, <- invalid
    33,3 <- invalid
    3,33 <- invalid
    ,333 <- invalid
    3,33, <- invalid
    3,3,3 <- invalid
    3,,33 <- invalid
    ,,333 <- invalid
    4444, <- invalid
    444,4 <- invalid
    44,44 <- invalid
    4,444
    ,4444 <- invalid
    55555, <- invalid
    5555,5 <- invalid
    555,55 <- invalid
    55,555
    5,5555 <- invalid
    ,55555 <- invalid
    666666, <- invalid
    66666,6 <- invalid
    6666,66 <- invalid
    666,666
    66,6666 <- invalid
    6,66666 <- invalid
    66,66,66 <- invalid
    6,66,666 <- invalid
    ,666,666 <- invalid
    1,111.
    1,111.11
    1,111.110
    01,111.110 <- invalid
    0,111.100 <- invalid
    11,11. <- invalid
    1,111,.11 <- invalid
    1111.1,10 <- invalid
    01111.11,0 <- invalid
    0111.100, <- invalid
    1,111,111.
    1,111,111.11
    1,111,111.110
    01,111,111.110 <- invalid
    0,111,111.100 <- invalid
    1,111,111.
    1,1111,11.11 <- invalid
    11,111,11.110 <- invalid
    01,11,1111.110 <- invalid
    0,111111.100 <- invalid
    0002,22.2230 <- invalid
    .,5.,., <- invalid
    2.0,345,345 <- invalid
    2.334.456 <- invalid
    

答案 7 :(得分:1)

\b\d+,

\ b ------->单词边界

\ d + ------>一个或数字

,-------->包含逗号

例如:

sddsgg 70,000 sdsfdsf fdgfdg70,00

sfsfsd 5,44,4343 5.7788,44 555

它将匹配:

70,

5

44,

,44

答案 8 :(得分:0)

这是一个正则表达式:

123456789

接受数字:

  • 没有空格和/或小数,例如。 123.123123 456 789
  • 用逗号或空格作为千​​位分隔符和/或小数,例如。 123 456 789.100123,4563,232,300,000.00,{{1}}

测试:http://regexr.com/3h1a2

答案 9 :(得分:0)

(,*[\d]+,*[\d]*)+

这将匹配以下带有或不带有逗号的任何小数字或大数字

1
100
1,262
1,56,262
10,78,999
12,34,56,789

1
100
1262
156262
1078999
123456789