假设我有一个包含每月 datetime
指数的数据表(以下代码给出了两年,从一月到十二月):
import pandas as pd
import numpy as np
from datetime import datetime
N = 12*2
c = [datetime(1970 + i//12, (i%12)+1, 1) for i in range(N)]
d = pd.DataFrame(np.random.rand(N), index=c)
print(d)
使用单独级别 DateTimeIndex
和MultiIndex
将month
转换为year
的最佳方式是什么?也许有一种方法可以用groupby
做到这一点,但我不确定。
答案 0 :(得分:4)
您可以从MultiIndex
和year
构建month
对象,并将其分配给数据框的索引:
import pandas as pd
d.index = pd.MultiIndex.from_arrays([d.index.year, d.index.month])
d.index
# MultiIndex(levels=[[1970, 1971], [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]],
# labels=[[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1], [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]])
d.head()
# 0
#1970 1 0.657130
# 2 0.047241
# 3 0.984799
# 4 0.868508
# 5 0.678536
答案 1 :(得分:0)
d.index = pd.MultiIndex.from_tuples(d.reset_index()['index'].\
apply(lambda x:(x.year,x.month)))