我有一个数据框:
df = pd.DataFrame({'unix_utc_ts': [1503007204222, 1503007210206, 1503007215121,
1503007220475], 'tz': ['+0000', '+0100', 'CEST', 'EEST']})
我想将unix时间戳转换为带有时区的datetime,所以我想要这样的东西:
df['local_ts'] = pd.to_datetime(df['unix_utc_ts'], unit='ms', tz=df['tz'])
上述代码不起作用。没有tz
参数,我得到了这个:
tz unix_utc_ts utc_ts
0 +0000 1503007204222 2017-08-17 22:00:04.222
1 +0100 1503007210206 2017-08-17 22:00:10.206
2 CEST 1503007215121 2017-08-17 22:00:15.121
3 EEST 1503007220475 2017-08-17 22:00:20.475
但是我当然希望时区包含在datetime中,所以我想要这个数据帧:
tz unix_utc_ts utc_ts local_ts
0 +0000 1503007204222 2017-08-17 22:00:04.222 2017-08-17 22:00:04.222
1 +0100 1503007210206 2017-08-17 22:00:10.206 2017-08-17 23:00:10.206
2 CEST 1503007215121 2017-08-17 22:00:15.121 2017-08-18 00:00:15.121
3 EEST 1503007220475 2017-08-17 22:00:20.475 2017-08-18 01:00:20.475
我已经搜索并阅读了很多stackoverflow问题,但没有找到任何可行的答案:(
谢谢!
答案 0 :(得分:1)
使用apply
和tz_localize
转换每一行:
import pandas as pd
df = pd.DataFrame({'unix_utc_ts': [1503007204222, 1503007210206, 1503007215121,
1503007220475], 'tz': ['CEST', 'EEST', 'CEST', 'EEST']})
df['datetime_utc'] = pd.to_datetime(df['unix_utc_ts'], unit='ms')
df['datetime_local'] = df.apply(lambda x: x['datetime_utc'].tz_localize(x['tz']), axis=1)
但是,您的时区格式会出现问题。 Pytz用于映射时区字符串,而您列出的字符串不匹配(here是我找到的列表)。因此,您必须制作从时区名称到Pytz的映射。