我有一个遗留应用程序,我需要补充一些数据。目前,我们有一个存储美国(及其地区)邮政编码的数据库表,以及GMT偏移量,以及一个显示Zipcode是否使用夏令时的标志。这是从一些免费提供商下载的,我现在无法找到它。
我现在需要用每个邮政编码的完整Olson名称(例如America/New York
)补充此表,因为这似乎是将存储在数据库中的给定日期/时间转换为本地的唯一好方法购买者进入UTC aware datetime
对象。
在这里查看表格:
zip state city lat lon gmt dst
00605 PR AGUADILLA 18.4372 -67.1593 -4 f
02830 RI HARRISVILLE 41.9782 -71.7679 -5 t
99503 AK ANCHORAGE 61.1895 -149.874 -9 t
在另一个相关表Purchases
中,我有一个postres
timestamp without tz
列,其中包含2014-05-27T15:54:26
之类的内容,代表本地购买的时间。邮政编码。 (忽略在将这些本地化时间戳保存到数据库时删除时区信息的愚蠢)
最大的问题是:
如何为UTC time
表格中的每个邮政编码从timestamp
字符串创建规范化zipcode
?这将假定时间戳已写入数据库,作为zipcode
表中每个示例行的本地时间。
例如,手动查找示例表中每个项目的Olson时区名称,我想出了以下内容:
>>> timestring = '2014-05-27T15:54:26'
>>> dt_naive = datetime.strptime(timestring, '%Y-%m-%dT%H:%M:%S')
>>> # First example - Puerto Rico (no DST since 1945)
>>> print pytz.utc.normalize(pytz.timezone('America/Puerto_Rico').localize(dt_naive))
2014-05-27 19:54:26+00:00
# Second example - Road Island (At that timestamp, UTC Offset was same as PR because of DST)
>>> print pytz.utc.normalize(pytz.timezone('US/Eastern').localize(dt_naive))
>>> 2014-05-27 19:54:26+00:00
# Third Example - Anchorage, AK (AKDT at timestamp)
>>> print pytz.utc.normalize(pytz.timezone('America/Anchorage').localize(dt_naive))
2014-05-27 23:54:26+00:00
我见过几个销售邮政编码数据库的商业产品,它可以给我一个邮政编码 - >时区查找。然而,他们似乎只给了我" EST"对于给定的时区。所以,我想我可以将美国时区(包括地区)的可能时区列表映射到每个时区的olson名称。这可能看起来像这样:
zipcode_olson_lookup = {
('PR', 'f', 'AST'): 'America/Puerto_Rico',
('AK', 'f', 'AKDT',): 'America/Anchorage',
('AK', 't', 'AKT',): 'America/Anchorage',
...
}
非常欢迎任何建议!
答案 0 :(得分:2)
UTC偏移本身可能不明确(它可能对应于在某个时间段内可能有不同规则的几个时区):
#!/usr/bin/env python
from datetime import datetime, timedelta
import pytz # $ pip install pytz
input_utc_offset = timedelta(hours=-4)
timezone_ids = set()
now = datetime.now(pytz.utc) #XXX: use date that corresponds to input_utc_offset instead!
for tz in map(pytz.timezone, pytz.all_timezones_set):
dt = now.astimezone(tz)
tzinfos = getattr(tz, '_tzinfos',
[(dt.tzname(), dt.dst(), dt.utcoffset())])
if any(utc_offset == input_utc_offset for utc_offset, _, _ in tzinfos):
# match timezones that have/had/will have the same utc offset
timezone_ids.add(tz.zone)
print(timezone_ids)
{'America/Anguilla',
'America/Antigua',
'America/Argentina/Buenos_Aires',
...,
'Cuba',
'EST5EDT',
'Jamaica',
'US/East-Indiana',
'US/Eastern',
'US/Michigan'}
您甚至无法使用pytz.country_timezones['us']
限制列表,因为它会排除您的一个示例:'America/Puerto_Rico'
。
如果你知道坐标(纬度,经度);您可以从the shape file: you could use a local database or a web-service获取时区ID:
#!/usr/bin/env python
from geopy import geocoders # pip install "geopy[timezone]"
g = geocoders.GoogleV3()
for coords in [(18.4372, -67.159), (41.9782, -71.7679), (61.1895, -149.874)]:
print(g.timezone(coords).zone)
America/Puerto_Rico
America/New_York
America/Anchorage
注意:某些本地时间可能不明确,例如,在DST转换结束时时间倒退。在这种情况下,您可以将is_dst=None
传递给.localize()
方法以引发异常。
the tz database的不同版本在某些日期可能对某些时区具有不同的utc偏移量,即,它不足以存储UTC时间和时区ID(使用的版本取决于您的应用程序)。