在Python中,我可以使用re.compile
编译正则表达式以区分大小写:
>>> s = 'TeSt'
>>> casesensitive = re.compile('test')
>>> ignorecase = re.compile('test', re.IGNORECASE)
>>>
>>> print casesensitive.match(s)
None
>>> print ignorecase.match(s)
<_sre.SRE_Match object at 0x02F0B608>
有没有办法做同样的事情,但没有使用re.compile
。我在文档中找不到Perl的i
后缀(例如m/test/i
)。
答案 0 :(得分:437)
将re.IGNORECASE
传递给search
,match
或sub
的flags
参数:
re.search('test', 'TeSt', re.IGNORECASE)
re.match('test', 'TeSt', re.IGNORECASE)
re.sub('test', 'xxxx', 'Testing', flags=re.IGNORECASE)
答案 1 :(得分:76)
您还可以使用搜索/匹配执行不区分大小写的搜索,而不使用IGNORECASE标志(在Python 2.7.3中测试):
re.search(r'(?i)test', 'TeSt').group() ## returns 'TeSt'
re.match(r'(?i)test', 'TeSt').group() ## returns 'TeSt'
答案 2 :(得分:37)
不区分大小写的标记(?i)
可以直接合并到正则表达式模式中:
>>> import re
>>> s = 'This is one Test, another TEST, and another test.'
>>> re.findall('(?i)test', s)
['Test', 'TEST', 'test']
答案 3 :(得分:9)
您还可以在模式编译期间定义不区分大小写:
pattern = re.compile('FIle:/+(.*)', re.IGNORECASE)
答案 4 :(得分:3)
#'re.IGNORECASE' for case insensitive results short form re.I
#'re.match' returns the first match located from the start of the string.
#'re.search' returns location of the where the match is found
#'re.compile' creates a regex object that can be used for multiple matches
>>> s = r'TeSt'
>>> print (re.match(s, r'test123', re.I))
<_sre.SRE_Match object; span=(0, 4), match='test'>
# OR
>>> pattern = re.compile(s, re.I)
>>> print(pattern.match(r'test123'))
<_sre.SRE_Match object; span=(0, 4), match='test'>
答案 5 :(得分:3)
在进口
import re
在运行时处理中:
RE_TEST = r'test'
if re.match(RE_TEST, 'TeSt', re.IGNORECASE):
应该提到的是,不使用re.compile
是浪费的。每次调用上面的匹配方法时,都会编译正则表达式。这在其他编程语言中也是错误的做法。以下是更好的做法。
在应用初始化中:
self.RE_TEST = re.compile('test', re.IGNORECASE)
在运行时处理中:
if self.RE_TEST.match('TeSt'):
答案 6 :(得分:1)
对于不区分大小写的正则表达式(Regex): 添加代码有两种方法:
flags=re.IGNORECASE
Regx3GList = re.search("(WCDMA:)((\d*)(,?))*", txt, **re.IGNORECASE**)
不区分大小写的标记(?i)
Regx3GList = re.search("**(?i)**(WCDMA:)((\d*)(,?))*", txt)
答案 7 :(得分:0)
要执行不区分大小写的操作,请提供re.IGNORECASE
>>> import re
>>> test = 'UPPER TEXT, lower text, Mixed Text'
>>> re.findall('text', test, flags=re.IGNORECASE)
['TEXT', 'text', 'Text']
如果我们要替换与大小写匹配的文本...
>>> def matchcase(word):
def replace(m):
text = m.group()
if text.isupper():
return word.upper()
elif text.islower():
return word.lower()
elif text[0].isupper():
return word.capitalize()
else:
return word
return replace
>>> re.sub('text', matchcase('word'), test, flags=re.IGNORECASE)
'UPPER WORD, lower word, Mixed Word'
答案 8 :(得分:0)
如果您想替换但仍保留先前str的样式。有可能。
例如:突出显示字符串“ test asdasd TEST asd tEst asdasd”。
sentence = "test asdasd TEST asd tEst asdasd"
result = re.sub(
'(test)',
r'<b>\1</b>', # \1 here indicates first matching group.
sentence,
flags=re.IGNORECASE)
测试 asdasd 测试 asd tEst asdasd