我的原始数据有一个时间戳为ISO8601格式的列,如下所示:
'2017-07-25T06:00:02 + 02:00'
由于数据是CSV格式,因此它将被读作对象/字符串。因此我将它转换为这样的日期时间。
import pandas pd
df['time'] = pd.to_datetime(df['time'], utc=False)
#df['time'][0]
df['time'][0].isoformat()
不幸的是,这会导致UTC时间戳,并且时区会丢失。例如 df ['time'] [0] .tzinfo 未设置。
时间戳('2017-07-25 04:00:02')
'2017-07-25T04:00:02'
我正在寻找一种方法来保留每个时区对象的时区信息。但之后没有将其重新设置为CEST(中欧夏令时),因为此信息已包含在原始数据中的ISO8601时区偏移中。知道怎么做吗?
答案 0 :(得分:8)
所以我在这里解决了这个问题。
这是一篇关于Timezones and Python的精彩文章,它帮助我找到了解决方案。它依赖于ISO8601 Python packages。
import iso8601
times = ['2017-07-25 06:00:02+02:00',
'2017-07-25 08:15:08+02:00',
'2017-07-25 12:08:00+02:00',
'2017-07-25 13:10:12+02:00',
'2017-07-25 15:11:55+02:00',
'2017-07-25 16:00:00+02:00'
]
df = pd.DataFrame(times, columns=['time'])
df['time'] = df['time'].apply(iso8601.parse_date)
df['time'][0]
产生以下输出并保留时区信息。
时间戳(' 2017-07-25 06:00:02 + 0200',tz =' +02:00')