Python正则表达式 - 匹配仅包含A,B或C的单词

时间:2013-05-20 13:06:07

标签: python regex match

我可以使用什么正则表达式来匹配仅由字符A,B或C组成的单词?例如,正则表达式将捕获ABCBACBACBABBABCC和A和B和C但不会捕获ABCD,ABC1等。

2 个答案:

答案 0 :(得分:8)

\b[ABC]+\b怎么样?这有用吗?

>>> regex = re.compile(r'\b[ABC]+\b')
>>> regex.match('AACCD')  #No match
>>> regex.match('AACC')   #match
<_sre.SRE_Match object at 0x11bb578>
>>> regex.match('A')      #match
<_sre.SRE_Match object at 0x11bb5e0>

\b是一个单词边界。因此,我们在这里匹配任何字边界,然后只匹配ABC个字符,直到下一个字边界。


对于那些不喜欢正则表达式的人,我们也可以在这里使用set个对象:

>>> set("ABC").issuperset("ABCABCABC")
True
>>> set("ABC").issuperset("ABCABCABC1")
False

答案 1 :(得分:0)

您要查找的正则表达式是r'\b([ABC]+)\b'

你可以编译它:

>>> regex = re.compile(r'\b([ABC]+)\b')

然后你可以用它做一些事情:

>>> regex.match('ABC') # find a match with whole string.
>>> regex.search('find only the ABC') # find a match within the whole string.
>>> regex.findall('this will find only the ABC elements in this ABC test text') # find 2 matches.

如果您想忽略这种情况,请使用:

>>> regex = re.compile(r'\b([ABC]+)\b', re.I)