Question

我的数据框'df'有多级索引（'STK_ID'，'RPT_Date'）：

    sales        cogs    net_pft
STK_ID RPT_Date                                   
600809 20120331  2214010000   509940000  492532000
       20111231  4488150000  1077190000  780547000
       20110930  3563660000   850789000  707537000
       20110630  2894820000   703883000  658625000

一些代码：

>>> df.index.names
['STK_ID', 'RPT_Date']

现在我希望通过以下方式获取RPT_Date列的系列值（20120331,20111231,20110930,20110630）：

>>> df['RPT_Date'] # not work

如何获取该数据？

Answer 1

我修好了。

df.index.get_level_values('RPT_Date')

array([20120331, 20111231, 20110930, 20110630, 20110331, 20101231,
       20100930, 20100630, 20100331, 20091231, 20090930, 20090630,
       20090331, 20081231, 20080930, 20080630, 20080331, 20071231,
       20070930, 20070630, 20070331, 20061231, 20060930, 20060630,
       20060331], dtype=object)

我觉得语法很难看，为什么Pandas的开发者不接受df['RPT_Date']的简单方法？

如何在python pandas中的多级索引中获取一个系列

1 个答案: