作为日志系统的一部分,我想解析来自Cisco设备的字符串时间戳,其格式如下:
# show clock
16:26:19.990 GMT+1 Wed Sep 11 2013
解析结果应该是一个UTC datetime
实例,它将存储在SQLite数据库中,因此需要进行时区转换。
仅使用datetime.strptime
是不够的,因为%Z
指令仅识别本地时区(即与当前$LANG
或$LC_*
环境相关的时区)。因此,我需要使用pytz包。
由于格式始终相同,我可以执行以下操作:
import pytz
from datetime import datetime
s = '16:26:19.990 CEST Wed Sep 11 2013'
tm, tz, dt = s.split(" ", 2)
naive = datetime.strptime("%s %s" % (tm, dt), "%H:%M:%S.%f %a %b %d %Y")
aware = naive.replace(timezone=pytz.timezone(tz))
universal = aware.astimezone(pytz.UTC)
然而,如果没有一些修改,这是行不通的。必须将tz
的值更正为pytz识别的名称。在示例中,pytz.timezone('CEST')
引发了UnknownTimezoneError
,因为实际时区为CET
。问题是当时没有应用夏令时修正:
>>> from datetime import datetime
>>> from pytz import UTC, timezone
>>> a = datetime.strptime('16:18:57.925 Wed Sep 11 2013', '%H:%M:%S.%f %a %b %d %Y')
>>> b = a.replace(tzinfo=timezone('CET'))
>>> a
datetime.datetime(2013, 9, 11, 16, 18, 57, 925000)
>>> b
datetime.datetime(2013, 9, 11, 16, 18, 57, 925000, tzinfo=<DstTzInfo 'CET' CET+1:00:00 STD>)
>>> b.astimezone(UTC)
datetime.datetime(2013, 9, 11, 15, 18, 57, 925000, tzinfo=<UTC>)
使用normalize
似乎没有帮助:
>>> timezone('CET').normalize(a)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/home/etanol/virtualenvs/plexus/local/lib/python2.7/site-packages/pytz/tzinfo.py", line 235, in normalize
raise ValueError('Naive time - no tzinfo set')
ValueError: Naive time - no tzinfo set
>>> timezone('CET').normalize(b)
datetime.datetime(2013, 9, 11, 17, 18, 57, 925000, tzinfo=<DstTzInfo 'CET' CEST+2:00:00 DST>)
我真的不知道我错过了什么,但想要的结果是:
datetime.datetime(2013, 9, 11, 14, 18, 57, 925000, tzinfo=<UTC>)
提前致谢。
答案 0 :(得分:1)
使用timezone.localize
:
>>> from datetime import datetime
>>> from pytz import UTC, timezone
>>>
>>> CET = timezone('CET')
>>>
>>> a = datetime.strptime('16:18:57.925 Wed Sep 11 2013', '%H:%M:%S.%f %a %b %d %Y')
>>> print CET.localize(a).astimezone(UTC)
2013-09-11 14:18:57.925000+00:00