仅当字符串包含','时才执行?

时间:2013-07-02 18:31:36

标签: python regex

我只是在我正在搜索的字符串包含逗号时才尝试执行一堆代码。

以下是我需要解析的一组示例行(name是此制表符分隔文件的列标题,而列(恼人地)包含名称,程度和练习区域:

name                             
Sam da Man J.D.,CEP
Green Eggs Jr. Ed.M.,CEP
Argle Bargle Sr. MA
Cersei Lannister M.A. Ph.D.

我的问题是,有些行包含一个逗号,后面跟着一个首字母缩写词,代表专业人士的“练习区域”,有些则没有。

我的代码依赖于每行包含一个逗号的原则,我现在必须修改代码以便考虑没有逗号的行。

def parse_ieca_gc(s):  

    ########################## HANDLE NAME ELEMENT ###############################

    degrees = ['M.A.T.','Ph.D.','MA','J.D.','Ed.M.', 'M.A.', 'M.B.A.', 'Ed.S.', 'M.Div.', 'M.Ed.', 'RN', 'B.S.Ed.', 'M.D.']
    degrees_list = []

    # separate area of practice from name and degree and bind this to var 'area'
    split_area_nmdeg = s['name'].split(',')
    area = split_area_nmdeg.pop() # when there is no area of practice and hence no comma, this pops out the name + deg and leaves an empty list, that's why 'print split_area_nmdeg' returns nothing and 'area' returns the name and deg when there's no comma
    print 'split area nmdeg'
    print area
    print split_area_nmdeg

    # Split the name and deg by spaces. If there's a deg, it will match with one of elements and will be stored deg list. The deg is removed name_deg list and all that's left is the name.
    split_name_deg = re.split('\s',split_area_nmdeg[0])
    for word in split_name_deg:
        for deg in degrees:
            if deg == word:
                degrees_list.append(split_name_deg.pop())
                name = ' '.join(split_name_deg)

    # area of practice
    category = area
看起来,re.search()和re.match()都不起作用,因为它们返回实例而不是布尔值,那么我应该用什么来判断是否有逗号?

3 个答案:

答案 0 :(得分:5)

在python中查看字符串是否包含字符的最简单方法是使用in。例如:

if ',' in s['name']:

答案 1 :(得分:1)

if re.match(...) is not None : 

而不是寻找布尔值。 Match在成功时返回MatchObject实例,在失败时返回None。

答案 2 :(得分:1)

您已在搜索逗号。只需使用该搜索的结果:

split_area_nmdeg = s['name'].split(',')
if len(split_area_nmdeg) > 2:
    print "Your old code goes here"
else:
    print "Your new code goes here"