正则表达式。查找多次出现的模式

时间:2017-05-15 15:40:23

标签: python regex

我有以下字符串

my_string = "this data is F56 F23 and G87"

我想使用正则表达式返回以下输出

['F56 F23', 'G87']

所以基本上,我有兴趣返回以F或G开头的字符串的所有部分,然后是两个数字。另外,如果连续多次出现,我希望正则表达式将它们组合在一起。

我用python和这段代码解决了这个问题

import re
re.findall(r'\b(F\d{2}|G\d{2})\b', my_string)

我能够得到所有事件

['F56', 'F23', 'G87']

但是我希望将前两个组合在一起,因为它们是连续出现的。关于如何实现这一目标的任何想法?

3 个答案:

答案 0 :(得分:3)

您可以使用此正则表达式:

\b[FG]\d{2}(?:\s+[FG]\d{2})*\b

非捕获组(?:\s+[FG]\d{2})*将找到零个或多个以下空格分隔的F / G子串。

<强>代码:

>>> my_string = "this data is F56 F23 and G87"
>>> re.findall(r'\b[FG]\d{2}(?:\s+[FG]\d{2})*\b', my_string)
['F56 F23', 'G87']

答案 1 :(得分:3)

  

所以基本上,我有兴趣返回以F或G开头的字符串的所有部分,然后是两个数字。此外,如果有多个连续出现,我希望正则表达式将它们组合在一起。

你可以这样做:

\b(?:[FG]\d{2})(?:\s+[FG]\d{2})*\b

如果它被分隔至少一个间距字符。如果这不是必需的,您可以使用以下方法执行此操作:

\b(?:[FG]\d{2})(?:\s*[FG]\d{2})*\b

第一个和第二个正则表达式都生成:

>>> re.findall(r'\b(?:[FG]\d{2})(?:\s+[FG]\d{2})*\b',my_string)
['F56 F23', 'G87']
>>> re.findall(r'\b(?:[FG]\d{2})(?:\s*[FG]\d{2})*\b',my_string)
['F56 F23', 'G87']

答案 2 :(得分:0)

ax.pcolormesh(lons, lats, data, 
            transform=ccrs.PlateCarree(),
            cmap='spectral', norm=MidpointNormalize(midpoint=0.8))

将正则表达式更改为r'((\ b(F \ d {2} | G \ d {2})\ b \ s *)+)'(括号,/ s *以查找全部,即通过空格连接,在最后一个括号后面加一个+来找到一个以上的出现(贪婪)

现在你有了一个列表列表,你需要每隔0个参数。您可以使用地图 lambda 。为了杀死最后一个空白,我使用 strip()