我有这个正则表达式,我正在使用将字符串拆分为我可以稍后处理的标记。我使用RegExr(在线工具)制作它,它在那里工作正常,但我不能让它在python中工作。我现在用它来打印比赛。
sunit = "A^2.1e2 m/s -180.2"
pat = "[A-Za-z]+(\^[-+]?[0-9]*\.?[0-9]+([eE][-+]?[0-9]+)?)?|\/|\*|[-+]?[0-9]*\.?[0-9]+([eE][-+]?[0-9]+)?"
Terms = re.findall(pat,sunit)
print Terms
正则表达式应该匹配:
A^2.1e2
m
/
s
-180.2
答案 0 :(得分:4)
解决了它。使用're.finditer()'而不是're.findall()'似乎有效。这就是我现在想出来的。很抱歉打扰你,很久以前我应该已经解决了这个问题。
sunit = r"A^2.1e2 m/s -180.2"
pat = r"[A-Za-z]+(\^[-+]?[0-9]*\.?[0-9]+([eE][-+]?[0-9]+)?)?|\/|\*|[-+]?[0-9]*\.?[0-9]+([eE][-+]?[0-9]+)?"
Terms = re.finditer(pat,sunit)
for m in Terms:
print m.group(0)
答案 1 :(得分:1)
您的正则表达式中有群组捕获(...)
。如果您不想捕获组,那么只需从那里删除括号。或者在括号内使用?:
忽略它,例如(?:...)
。我已更改了您的正则表达式,它将与re.findall
pat = "[A-Za-z]+(?:\^[-+]?[0-9]*\.?[0-9]+(?:[eE][-+]?[0-9]+)?)?|\/|\*|[-+]?[0-9]*\.?[0-9]+(?:[eE][-+]?[0-9]+)?"
^^ ^^ ^^