数据框df
包含df['country']
,df['sector']
和df['year']
上的列,还有其他数字数据混合int
和float
。国家和行业是categorical
个变量,年份为datetime64[ns]
。
我创建了一个3层层次结构,如下所示
arrays1 = [np.array(df['country']), np.array(df['sector']), np.array(df['year'])]
df1 = df.set_index(arrays1)
df1.index.names = ['country','sector', 'year']
df1 = df1.sort_index()
如何创建此多重索引以确保第三级year
被识别为频率年度的datetimeIndex?
答案 0 :(得分:1)
似乎你需要:
df1 = df.set_index(['country','sector','year']).sort_index()
然后,您可以通过get_level_values
检查level
的{{1}}:
MultiIndex