使用python正则表达式匹配日期

时间:2012-04-02 14:47:21

标签: python regex python-3.x

我希望匹配具有以下格式的日期:

2010-08-27, 2010/08/27

现在我并不是特别关注日期实际可行,只是它的格式正确。

请告诉正则表达式。

由于

4 个答案:

答案 0 :(得分:22)

您可以使用datetime模块来解析日期:

import datetime

print datetime.datetime.strptime('2010-08-27', '%Y-%m-%d')
print datetime.datetime.strptime('2010-15-27', '%Y-%m-%d')

输出:

2010-08-27 00:00:00
Traceback (most recent call last):
  File "./x.py", line 6, in <module>
    print datetime.datetime.strptime('2010-15-27', '%Y-%m-%d')
  File "/usr/lib/python2.7/_strptime.py", line 325, in _strptime
    (data_string, format))
ValueError: time data '2010-15-27' does not match format '%Y-%m-%d'

所以抓住ValueError会告诉你日期是否匹配:

def valid_date(datestring):
    try:
        datetime.datetime.strptime(datestring, '%Y-%m-%d')
        return True
    except ValueError:
        return False

要允许各种格式,您可以测试所有可能性,或使用re首先解析字段:

import datetime
import re

def valid_date(datestring):
        try:
                mat=re.match('(\d{2})[/.-](\d{2})[/.-](\d{4})$', datestring)
                if mat is not None:
                        datetime.datetime(*(map(int, mat.groups()[-1::-1])))
                        return True
        except ValueError:
                pass
        return False

答案 1 :(得分:12)

您可以使用此代码:

import re

# regular expression to match dates in format: 2010-08-27 and 2010/08/27 
# date_reg_exp = re.compile('(\d+[-/]\d+[-/]\d+)')

更新了以下正则表达式:

# regular expression to match dates in format: 2010-08-27 and 2010/08/27
# and with mixed separators 2010/08-27
# date_reg_exp = re.compile('\d{4}[-/]\d{2}[-/]\d{2}')

# if separators should not be mixed use backreference:
date_reg_exp = re.compile('\d{4}(?P<sep>[-/])\d{2}(?P=sep)\d{2}')

# a string to test the regular expression above
test_str= """
     fsf2010/08/27sdfsdfsd
     dsf sfds f2010/08/26 fsdf 
     asdsds 2009-02-02 afdf
     """
# finds all the matches of the regular expression and
# returns a list containing them
matches_list=date_reg_exp.findall(test_str)

# iterates the matching list and prints all the matches
for match in matches_list:
  print match

答案 2 :(得分:4)

使用datetime模块。虽然你不应该使用它,但是为了知识,这是一个正则表达式:

r'\d{4}[-/]\d{2}[-/]\d{2}'

答案 3 :(得分:2)

dateutil包有一个非常聪明的日期解析器。它解析各种日期格式。 http://pypi.python.org/pypi/python-dateutil