匹配必需的字符串并将一部分分配给Python中的正则表达式分组

时间:2013-04-25 21:42:59

标签: python regex

我有以下代码片段:

names[count]=osd.0
for line_2 in osd_tree.stdout:
   match_2 = re.search(r"%s*(\bup\b|\bdown\b)" % names[count], line_2)
      if match_2:
      status.append(match_2.group(1))
print status

我正在循环他以下几行:

# id    weight  type name       up/down reweight
-1      40.25   pool default   
-3      40.25           rack unknownrack
-2      10.6                    host NC-T920-SAN-10-00
1       1.1                             osd.1   up      1
2       1                               osd.2   up      1
3       1.1                             osd.3   up      1
4       1.1                             osd.4   up      1
5       1.1                             osd.5   up      1
0       1.1                             osd.0   up      1
24      0.8                             osd.24  up      1
25      1.1                             osd.25  up      1
26      1.1                             osd.26  up      1
27      1.1                             osd.27  up      1

在我看来,这个正则表达式应该寻找一个在“ofdwix”和(向上或向下)中包含“osd.0”字符的行。然后它将(向上或向下)分配给组(1)。我似乎没有得到匹配。至少我应该说打印状态的返回是[]。

顺便说一下,我还想在表达式中绑定初始变量,以便osd.1和osd.17不会创建相同的匹配,但是当我有以下代码时,会产生以下错误。很明显,语法不正确:

match_2 = re.search(r"\b%s\b*(\bup\b|\bdown\b)" % names[count], line_2)

Traceback (most recent call last):
  File "./snmp_osd_check.py", line 44, in <module>
  number, names, status = get_osds()
File "./snmp_osd_check.py", line 33, in get_osds
  match_2 = re.search(r"\b%s\b*(\bup\b|\bdown\b)" % names[count], line_2)
File "/usr/lib/python2.7/re.py", line 142, in search
  return _compile(pattern, flags).search(string)
File "/usr/lib/python2.7/re.py", line 242, in _compile
  raise error, v # invalid expression
sre_constants.error: nothing to repeat

有什么想法吗?

对于下面的评论,我有以下代码,并且在其他地方工作正常:

 for line in osds.stdout:
  match = re.search(r"(\bosd\.[0-9]*\b)", line)
  if match:
     names.append(match.group(1))
     number.append(count)

如果没有匹配,则跳过该行并继续前进,如果匹配,则将组(1)分配给列表。我并不是要争论这一点,但我试图理解为什么这个用例不同。

1 个答案:

答案 0 :(得分:2)

正则表达式中没有任何内容可以匹配osd.0up之间的空格,并且您使用*量词是不合适的。

例如,osd.0*表示匹配osd后跟任意一个字符(换行符除外),后跟字符0零次或多次。

如果您使用re.escape(names[count]),则会转义非字母数字字符以防止将其视为特殊的正则表达式字符,即osd.0将被视为osd\.0

尝试添加\s,以便匹配零个或多个空格字符

r"\b%s\s*\b(up|down)\b"