Python pandas将带有时区的unix时间戳转换为datetime

时间:2017-08-30 16:11:46

标签: python pandas datetime timezone

我有一个数据框:

df = pd.DataFrame({'unix_utc_ts': [1503007204222, 1503007210206, 1503007215121,
    1503007220475], 'tz': ['+0000', '+0100', 'CEST', 'EEST']})

我想将unix时间戳转换为带有时区的datetime,所以我想要这样的东西:

df['local_ts'] = pd.to_datetime(df['unix_utc_ts'], unit='ms', tz=df['tz'])

上述代码不起作用。没有tz参数,我得到了这个:

      tz    unix_utc_ts                  utc_ts
0  +0000  1503007204222 2017-08-17 22:00:04.222
1  +0100  1503007210206 2017-08-17 22:00:10.206
2   CEST  1503007215121 2017-08-17 22:00:15.121
3   EEST  1503007220475 2017-08-17 22:00:20.475

但是我当然希望时区包含在datetime中,所以我想要这个数据帧:

      tz    unix_utc_ts                  utc_ts                local_ts
0  +0000  1503007204222 2017-08-17 22:00:04.222 2017-08-17 22:00:04.222
1  +0100  1503007210206 2017-08-17 22:00:10.206 2017-08-17 23:00:10.206
2   CEST  1503007215121 2017-08-17 22:00:15.121 2017-08-18 00:00:15.121
3   EEST  1503007220475 2017-08-17 22:00:20.475 2017-08-18 01:00:20.475

我已经搜索并阅读了很多stackoverflow问题,但没有找到任何可行的答案:(

谢谢!

1 个答案:

答案 0 :(得分:1)

使用applytz_localize转换每一行:

import pandas as pd
df = pd.DataFrame({'unix_utc_ts': [1503007204222, 1503007210206, 1503007215121,
1503007220475], 'tz': ['CEST', 'EEST', 'CEST', 'EEST']})

df['datetime_utc'] = pd.to_datetime(df['unix_utc_ts'], unit='ms')
df['datetime_local'] = df.apply(lambda x: x['datetime_utc'].tz_localize(x['tz']), axis=1)

但是,您的时区格式会出现问题。 Pytz用于映射时区字符串,而您列出的字符串不匹配(here是我找到的列表)。因此,您必须制作从时区名称到Pytz的映射。