我有正则表达式在字符串中找到长度为6的字母数字。字符串如下所示:
PLT\n\nTRAVELLER NAME LIST\n\n TRAVELLER RECLOC COMPANY\n 1 TESTNUMBERFIVEQA/TESTN WL9795\n 2 TESTNUMBERONEYQWA/TEST RHFQCD\n 3 TESTNUMBERONEYQWAZZZ/T 1QZ1JF\n 4 TESTNUMBERONEYQWAZZZM/ N3BZW8\n 5 TESTNUMBERONEYQWAZZZMK 05RXPM\n 6 TESTNUMBERONEYQWAZZZMK 2XR9ZR\n 7 TESTNUMBERTHREEZZZ/TES 0Q14S4\n 8 TESTNUMBERTHREEZZZM/TE LRRKW3\n 9 TESTNUMBERTHREEZZZMK/T 949Z4T\n 10 TESTNUMBERTHREEZZZMKJ/ 51WFM2\n 11 TESTNUMBERTWOZZA/TESTN PRGWVT\n 12 TESTNUMBERTWOZZAZZZ/TE SM0BHS\n 13 TESTNUMBERTWOZZAZZZM/T QRJLH1\n 14 TESTNUMBERTWOZZAZZZMK/ R69NHV\n 15 TESTNUMBERTWOZZAZZZMKJ 67XKF7\n 16 TESTNUMBERTWOZZAZZZMKJ 68PV7P\n 17 TESTNUMBERTWOZZAZZZMKJ GCZZ0C\n)> 18 TESTNUMBERTWOZZAZZZMKJ MLMS3L\n 19 TESTNUMBERTWOZZAZZZMKJ 3R1S49\n 20 TESTNUMBERTWOZZAZZZMKJ WB700R\n 21 TESTNUMBERTWOZZAZZZMKJ 718KRC\n 22 TESTNUMBERTWOZZAZZZMKJ RTQH2H\n 23 TESTNUMBERTWOZZAZZZMKJ N2FLM6\n 24 TESTNUMBERTWOZZAZZZMKJ 40M1FR\n 25 TESTNUMBERTWOZZAZZZMKJ 71D3HF\n 26
我试过的正则表达式是这样的:
for k in mainString:
m = re.match('([0-9A-Z]{6})', k)
if (m):
do something
但它没有按预期工作。有人可以指出我可能犯错吗? 我正在寻找的模式就像WL9795,RHFQCD等。
感谢
答案 0 :(得分:5)
match
方法仅检查字符串开头的匹配项。
改为使用search
方法!
此外,()
是不必要的。
如果代码中的mainString
实际上是问题顶部的字符串,则代码将无法正常工作,因为for
循环将遍历该字符串中的所有单个字符。
相反,你可以使用
m = re.search(r'\b[0-9A-Z]{6}\b', mainString)
if (m):
print(m.group())
正则表达式之前的r
确保\b
不被视为字符串转义序列。
\b
平均字边界,并确保6个字符的字母数字不在单词字符之前或之后。没有它们,第一场比赛将是"TRAVEL"
中的"TRAVELLER"
。
如果您想获得所有匹配的列表,请使用findall
或finditer
代替search
。
for m in re.finditer(r'\b[0-9A-Z]{6}\b', mainString):
print(m.group())
答案 1 :(得分:3)
在我看来,你可能想要一些单词边界:
>>> print re.findall(r'\b\w{6}\b',s)
['RECLOC', 'WL9795', 'RHFQCD', '1QZ1JF', 'N3BZW8', '05RXPM', '2XR9ZR', '0Q14S4', 'LRRKW3', '949Z4T', '51WFM2', 'PRGWVT', 'SM0BHS', 'QRJLH1', 'R69NHV', '67XKF7', '68PV7P', 'GCZZ0C', 'MLMS3L', '3R1S49', 'WB700R', '718KRC', 'RTQH2H', 'N2FLM6', '40M1FR', '71D3HF']
此正则表达式匹配字母长度正好的字母数字模式。换句话说,它与"foobarbaz"
中的任何内容都不匹配,但它与foobar
中的"foobar."
匹配