我需要在网页中匹配无数个数字。
我需要能够匹配以下所有格式:
100 $
99$
$99
$ 8
$.99
$ .8
$ 99.8
.99$
.99 $
9.2 $
1.2$
等效使用逗号:
444,333
22,333
1,222
11,111,111
333,333,333,333.01132
或空格:
444 333
22 333
1 222
11 111 111
333 333 333 333.01132
这对我来说真的很难。我习惯玩regexp,但我完全没有写出一些防弹证明。通常http://www.regexlib.com有解决方案,但不适用于此。
除了使用regexp之外,我无法想到另一种方式,因为它是纯文本搜索/替换。
答案 0 :(得分:6)
这是一个正则表达式,它将匹配您提供的所有数字格式:
^(?:\$\s*)?(?:(?:\d{0,3}(?:[, ]\d{0,3})*[, ])+\d{3}|\d+)(?:\.\d*)?(?:\s*\$)?$
要打破它:
^(?:\$\s*)?
将在字符串的开头查找可选的$,后跟任意数量的空格(?:(?:\d{0,3}(?:[, ]\d{0,3])*[, ])+\d{3}|\d*)
将匹配分为逗号或空格(\d{0,3}(?:[, ]\d{0,3})*[, ])+\d{3}
)或一串数字(\d+
)的分组中的数字 - 所以123,456,789,123 456 789和123456789都将匹配。正则表达式不接受具有不正确分组的数字(因此123,45,6789将不匹配)(?:\.\d*)?
将匹配一个带有可选小数的数字和(?:\s*\$)?$
将匹配字符串末尾的可选$,前面有任意数量的空格。答案 1 :(得分:5)
为什么要写1个正则表达式,当你可以写几个,然后轮流应用它们?
我假设(?)你可以逐行迭代。为什么不尝试使用精通逗号的正则表达式,然后是精通空间的正则表达式等等?如果匹配,则不要费心去尝试其余的,然后存储结果并转到下一行。
答案 2 :(得分:0)
如何分两步完成:
首先用''
替换所有空格然后,如果数字格式始终相同,则可以用''
替换逗号之后,它很简单,没有?