我遇到与不区分大小写搜索正则表达式有关的问题。这是我写的代码的一部分:
engType = 'XM665'
engType
的值是从其他文件中提取的。基于engType,我想在另一个包含该部分的文本文件中找到行并从该行提取描述信息,描述部分将在engType
字符串和'Serial'
之间。
例如:
lines = ['xxxxxxxxxxx','mmmmmmmmmmm','jjjjj','xM665 Module 01 Serial (10-11)']
pat = re.compile(engType+'(.*?)[Ss][Ee][Rr][Ii][Aa][Ll]')
for line in lines:
des = pat.search(line).strip()
if des:
break;
print des.group(1).strip()
我知道结果将是一个错误,因为我的字符串engType
的情况与'xM665 Module 01 Serial (10-11)'
中的情况不同,我知道我可以使用[Ss]
来执行不区分大小写的比较正如我在pat
的最后部分所做的那样。但是,由于我的engType是一个变量,我无法将其应用于变量。我知道我可以用小写字母搜索:
lines = ['xxxxxxxxxxx','mmmmmmmmmmm','jjjjj','xM665 Module 01 Serial (10-11)']
pat = re.compile(engType.lower()+'(.*?)serial')
for line in lines:
des = pat.search(line.lower()).strip()
if des:
break;
print des.group(1).strip()
结果:
module 01
与Module 01
相比,现在情况有所不同。如果我想保留这个案子,我该怎么做?谢谢!
答案 0 :(得分:2)
re.IGNORECASE
是您正在寻找的旗帜。
pat = re.compile(engType+'(.*?)[Ss][Ee][Rr][Ii][Aa][Ll]',re.IGNORECASE)
或者更简单地re.compile(engType+'(.*?)serial',re.IGNORECASE)
。
另外,这行中的错误:
des = pat.search(line.lower()).strip()
删除.strip()
;如果pat.search()
为None
,您将获得AttributeError
。
答案 1 :(得分:1)
查看http://docs.python.org/3/library/re.html
中的re.IGNORECASE我相信它看起来像:
pat = re.compile(engType.lower()+'(.*?)serial', re.IGNORECASE)