我的数据框'df'有多级索引('STK_ID','RPT_Date'):
sales cogs net_pft
STK_ID RPT_Date
600809 20120331 2214010000 509940000 492532000
20111231 4488150000 1077190000 780547000
20110930 3563660000 850789000 707537000
20110630 2894820000 703883000 658625000
一些代码:
>>> df.index.names
['STK_ID', 'RPT_Date']
现在我希望通过以下方式获取RPT_Date列的系列值(20120331,20111231,20110930,20110630):
>>> df['RPT_Date'] # not work
如何获取该数据?
答案 0 :(得分:2)
我修好了。
df.index.get_level_values('RPT_Date')
array([20120331, 20111231, 20110930, 20110630, 20110331, 20101231,
20100930, 20100630, 20100331, 20091231, 20090930, 20090630,
20090331, 20081231, 20080930, 20080630, 20080331, 20071231,
20070930, 20070630, 20070331, 20061231, 20060930, 20060630,
20060331], dtype=object)
我觉得语法很难看,为什么Pandas的开发者不接受df['RPT_Date']
的简单方法?