Question

我有以下字符串

my_string = "this data is F56 F23 and G87"

我想使用正则表达式返回以下输出

['F56 F23', 'G87']

所以基本上，我有兴趣返回以F或G开头的字符串的所有部分，然后是两个数字。另外，如果连续多次出现，我希望正则表达式将它们组合在一起。

我用python和这段代码解决了这个问题

import re
re.findall(r'\b(F\d{2}|G\d{2})\b', my_string)

我能够得到所有事件

['F56', 'F23', 'G87']

但是我希望将前两个组合在一起，因为它们是连续出现的。关于如何实现这一目标的任何想法？

Answer 1

您可以使用此正则表达式：

\b[FG]\d{2}(?:\s+[FG]\d{2})*\b

非捕获组(?:\s+[FG]\d{2})*将找到零个或多个以下空格分隔的F / G子串。

<强>代码：

>>> my_string = "this data is F56 F23 and G87"
>>> re.findall(r'\b[FG]\d{2}(?:\s+[FG]\d{2})*\b', my_string)
['F56 F23', 'G87']

Answer 2

所以基本上，我有兴趣返回以F或G开头的字符串的所有部分，然后是两个数字。此外，如果有多个连续出现，我希望正则表达式将它们组合在一起。

你可以这样做：

\b(?:[FG]\d{2})(?:\s+[FG]\d{2})*\b

如果它被分隔至少一个间距字符。如果这不是必需的，您可以使用以下方法执行此操作：

\b(?:[FG]\d{2})(?:\s*[FG]\d{2})*\b

第一个和第二个正则表达式都生成：

>>> re.findall(r'\b(?:[FG]\d{2})(?:\s+[FG]\d{2})*\b',my_string)
['F56 F23', 'G87']
>>> re.findall(r'\b(?:[FG]\d{2})(?:\s*[FG]\d{2})*\b',my_string)
['F56 F23', 'G87']

Answer 3

ax.pcolormesh(lons, lats, data, 
            transform=ccrs.PlateCarree(),
            cmap='spectral', norm=MidpointNormalize(midpoint=0.8))

将正则表达式更改为r'（（\ b（F \ d {2} | G \ d {2}）\ b \ s *）+）'（括号，/ s *以查找全部，即通过空格连接，在最后一个括号后面加一个+来找到一个以上的出现（贪婪）

现在你有了一个列表列表，你需要每隔0个参数。您可以使用地图和 lambda 。为了杀死最后一个空白，我使用 strip（）

正则表达式。查找多次出现的模式

3 个答案: