我正在处理时间序列数据,其中我的pandas数据框具有以小时为单位指定的索引,如下所示:
[0.0, 0.2, 0.4, 0.6, 0.8, 1.0, 1.2, 1.4, 1.6, 1.8, 2.0, 2.2, 2.4, ...]
这持续了数千个小时。我知道进行了第一次测量,比方说,May 1, 2017 12:00
。如何使用这些信息将索引转换为熊猫的日期时间格式?
答案 0 :(得分:1)
您可以为origin
的{{3}}中的参数DatetimeIndex
添加小时来建立索引:
idx = [0.0, 0.2, 0.4, 0.6, 0.8, 1.0, 1.2, 1.4, 1.6, 1.8, 2.0, 2.2, 2.4]
df = pd.DataFrame({'a':range(13)}, index=idx)
start = 'May 1, 2017 12:00'
df.index = pd.to_datetime(df.index, origin=start, unit='h')
print (df)
a
2017-05-01 12:00:00 0
2017-05-01 12:12:00 1
2017-05-01 12:24:00 2
2017-05-01 12:36:00 3
2017-05-01 12:48:00 4
2017-05-01 13:00:00 5
2017-05-01 13:12:00 6
2017-05-01 13:24:00 7
2017-05-01 13:36:00 8
2017-05-01 13:48:00 9
2017-05-01 14:00:00 10
2017-05-01 14:12:00 11
2017-05-01 14:24:00 12
答案 1 :(得分:0)
您可以使用pandas.date_range
根据index
的长度(在这种情况下为列表)指定周期数,并指定频率(在这种情况下为12min
或1/5 H
:
l = [0.0, 0.2, 0.4, 0.6, 0.8, 1.0, 1.2, 1.4, 1.6, 1.8, 2.0, 2.2, 2.4]
data = {'Num':np.random.randint(1, 10, size=len(l))}
idx = pd.date_range(start=pd.Timestamp(2017, 5, 1, 12), periods=len(l), freq='12T')
df = pd.DataFrame(data = data, index= idx)
print(df)
Num
2017-05-01 12:00:00 8
2017-05-01 12:12:00 3
2017-05-01 12:24:00 3
2017-05-01 12:36:00 4
2017-05-01 12:48:00 8
2017-05-01 13:00:00 3
2017-05-01 13:12:00 6
2017-05-01 13:24:00 3
2017-05-01 13:36:00 4
2017-05-01 13:48:00 9
2017-05-01 14:00:00 5
2017-05-01 14:12:00 2
2017-05-01 14:24:00 6