如何在Python中解析和比较ISO 8601持续时间?

时间:2014-08-13 21:25:29

标签: python iso8601

我正在寻找Python(v2)中的库,这将允许我解析和比较可能在不同单位的ISO 8601持续时间

理想情况下,它可以与标准运算符一起使用(a< b)但是我会很喜欢a.compare(b)或者。

如下所示:

duration('P23M') < duration('P2Y') //True
duration('P25M') < duration('P2Y') //False

我已经从PyPi安装了isodate,但是它有自己的类,包括月份和年份,并且它们与自身或timedeltas不相比

3 个答案:

答案 0 :(得分:6)

这里有一点点持续时间(一个月是30天,一年是平均值等):

# parse 8601 duration
from re import findall

def iso8601_duration_as_seconds( d ):
    if d[0] != 'P':
        raise ValueError('Not an ISO 8601 Duration string')
    seconds = 0
    # split by the 'T'
    for i, item in enumerate(d.split('T')):
        for number, unit in findall( '(?P<number>\d+)(?P<period>S|M|H|D|W|Y)', item ):
            # print '%s -> %s %s' % (d, number, unit )
            number = int(number)
            this = 0
            if unit == 'Y':
                this = number * 31557600 # 365.25
            elif unit == 'W': 
                this = number * 604800
            elif unit == 'D':
                this = number * 86400
            elif unit == 'H':
                this = number * 3600
            elif unit == 'M':
                # ambiguity ellivated with index i
                if i == 0:
                    this = number * 2678400 # assume 30 days
                    # print "MONTH!"
                else:
                    this = number * 60
            elif unit == 'S':
                this = number
            seconds = seconds + this
    return seconds

for d in [ 'PT10M', 'PT5H', 'P3D', 'PT45S', 'P8W', 'P7Y', 'PT5H10M', 'P2YT3H10M', 'P3Y6M4DT12H30M5S', 'P23M', 'P2Y' ]:
    seconds = iso8601_duration_as_seconds( d )
    print "%s \t= %s" % (d,seconds)
    print


print '%s' % (iso8601_duration_as_seconds('P23M') < iso8601_duration_as_seconds('P2Y') )
# True
print '%s' % (iso8601_duration_as_seconds('P25M') < iso8601_duration_as_seconds('P2Y') )
# False

答案 1 :(得分:2)

我最终解决的问题&#34;如果将句点添加到保持当前UTC时间的值,则通过比较结果值。这当然意味着在2月期间,P30D比P1M长,3月它更短,4月则相等。不理想,但很好地满足了我的需求。

答案 2 :(得分:0)

面对同样的问题,我使用正则表达式来解析持续时间并比较结果的秒数:

def duration(duration_str):
    match = re.match(
        r'P(?P<years>\d+)Y)?(?P<months>\d+)M)?(?P<weeks>\d+)W)?(?P<days>\d+)D)?T((?P<hours>\d+)H)?((?P<minutes>\d+)M)?((?P<seconds>\d+)S)?',
        duration_str
    ).groupdict()
    return int(match['years'] or 0)*365*24*3600 + \
        int(match['months'] or 0)*30*24*3600 + \
        int(match['weeks'] or 0)*7*24*3600 + \
        int(match['days'] or 0)*24*3600 + \
        int(match['hours'] or 0)*3600 + \
        int(match['minutes'] or 0)*60 + \
        int(match['seconds'] or 0)

请注意,这隐含地假设一年是365天,一个月是30天等等。