如何在python中使用正则表达式时忽略大小写?

时间:2013-11-22 05:13:11

标签: python regex

我遇到与不区分大小写搜索正则表达式有关的问题。这是我写的代码的一部分:

engType = 'XM665'

engType的值是从其他文件中提取的。基于engType,我想在另一个包含该部分的文本文件中找到行并从该行提取描述信息,描述部分将在engType字符串和'Serial'之间。

例如:

lines = ['xxxxxxxxxxx','mmmmmmmmmmm','jjjjj','xM665 Module 01 Serial (10-11)']
pat = re.compile(engType+'(.*?)[Ss][Ee][Rr][Ii][Aa][Ll]')
for line in lines:
    des = pat.search(line).strip()
    if des:
        break;
print des.group(1).strip()

我知道结果将是一个错误,因为我的字符串engType的情况与'xM665 Module 01 Serial (10-11)'中的情况不同,我知道我可以使用[Ss]来执行不区分大小写的比较正如我在pat的最后部分所做的那样。但是,由于我的engType是一个变量,我无法将其应用于变量。我知道我可以用小写字母搜索:

lines = ['xxxxxxxxxxx','mmmmmmmmmmm','jjjjj','xM665 Module 01 Serial (10-11)']
pat = re.compile(engType.lower()+'(.*?)serial')
for line in lines:
    des = pat.search(line.lower()).strip()
    if des:
        break; 
print des.group(1).strip()

结果:

module 01

Module 01相比,现在情况有所不同。如果我想保留这个案子,我该怎么做?谢谢!

2 个答案:

答案 0 :(得分:2)

re.IGNORECASE是您正在寻找的旗帜。

pat = re.compile(engType+'(.*?)[Ss][Ee][Rr][Ii][Aa][Ll]',re.IGNORECASE)

或者更简单地re.compile(engType+'(.*?)serial',re.IGNORECASE)

另外,这行中的错误:

des = pat.search(line.lower()).strip()

删除.strip();如果pat.search()None,您将获得AttributeError

答案 1 :(得分:1)

查看http://docs.python.org/3/library/re.html

中的re.IGNORECASE

我相信它看起来像:

pat = re.compile(engType.lower()+'(.*?)serial', re.IGNORECASE)