Python正则表达式在文本文件中的特定字符串搜索期间使用

时间:2013-04-24 14:25:21

标签: python regex

我必须在文本文件中找到一个表达式:StartTime="4/11/2013 8:11:20:965" and EndTime="4/11/2013 8:11:22:571"

所以我使用了正则表达式

r'(\w)="(\d{1,2}/\d{1,2}/\d{4} \d{1,2}:\d{1,2}:\d{1,2}:\d{2,3})"'

再次感谢eumiro先前的帮助(Retrieve randomly preformatted text from Text File

但我在文件中找不到任何内容,我检查过它。

我实际上不能用它来获取'GetDuration lvl 1'。

我试图将我的正则表达式简化为r'(\d)',并且它适用于lvl 4,所以我认为它可能并最终受到保护"的问题但我在python中没有看到任何相关内容文件:

我错过了什么?

Regular_Exp = r'(\w)="(\d{1,2}/\d{1,2}/\d{4} \d{1,2}:\d{1,2}:\d{1,2}:\d{2,3})"'

def getDuration(timeCode1, timeCode2)
    duration =0
    c = ''
    print 'GetDuration lvl 0'
    for c in str(timeCode1) :
        m = re.search(Regular_Exp, c)
        print 'GetDuration lvl 1'

        if m:
            print 'GetDuration lvl 2'
            for text in str(timeCode2) :
                print 'GetDuration lvl 3'
                n = re.search(Regular_Exp, c)
                if n:
                    print 'GetDuration lvl 4'
                    timeCode1Split = timeCode1.split(' ')
                    timeCode1Date = timeCode1Split[0].split('/')
                    timeCode1Heure = timeCode1Split[1].split(':')

                    timeCode2Split = timeCode2.split(' ')
                    timeCode2Date = timeCode2Split[0].split('/')
                    timeCode2Heure = timeCode2Split[1].split(':')

                    timeCode1Date = dt.datetime(timeCode1Date[0], timeCode1Date[1], timeCode1Date[2], timeCode1Heure[0], timeCode1Heure[0], timeCode1Heure[0], tzinfo=utc)
                    timeCode2Date = dt.datetime(timeCode2Date[0], timeCode2Date[1], timeCode2Date[2], timeCode2Heure[0], timeCode2Heure[0], timeCode2Heure[0], tzinfo=utc)

                    print 'TimeCode'
                    print timeCode1Date
                    print timeCode2Date

                duration += timeCode1Date - timeCode2Date

    return duration

2 个答案:

答案 0 :(得分:1)

for c in str(timeCode1) :
    m = re.search(Regular_Exp, c)

    ...

for x in str(something)表示您逐个字符地迭代something(一次一个字符= 1个长度str),并且没有正则表达式可以与之匹配。

答案 1 :(得分:1)

也许这个exp应该有帮助:

"(\w+?)=\"(.+?)\""

使用:

>>> string = u'StartTime="4/11/2013 8:11:20:965" and EndTime="4/11/2013 8:11:22:571"'
>>> regex = re.compile("(\w+?)=\"(.+?)\"")
# Run findall
>>> regex.findall(string)
[(u'StartTime', u'4/11/2013 8:11:20:965'), (u'EndTime', u'4/11/2013 8:11:22:571')]

另外,for c in str(timeCode1),尝试打印c,你一次只能使用一个字符,而不是正则表达式。