如何使用Pandas MultiIndex中只有一个标签的值列表进行索引

时间:2012-04-04 19:27:15

标签: python pandas multi-index

我正在尝试使用pandas multiindex在顶级索引(日期)中选择部分切片,并将列表应用于第二级索引(股票代码)。即下面我希望AAPL和MSFT的数据在d1:d2范围内。

部分切片工作正常,但不清楚如何从第二个索引中选择AAPL和MSFT,同时在中间避免使用GOOG。

如果我交换级别,它可以使用单个符号,但不能使用列表。

In [93]: print df
                 f1  f2  c1
date       sym
2012-01-01 AAPL  5.  2   3
           GOOG  1.  2   3
           MSFT  4.  2   3
2012-01-02 AAPL  8.  2   3
           GOOG  6.  2   3
           MSFT  7.  2   3
2012-01-03 AAPL  11  2   3
           GOOG  9.  2   3
           MSFT  10  2   3

In [94]: print df.ix[d1:d2].swaplevel(0,1).ix['AAPL']
            f1  f2  c1
date
2012-01-01  5   2   3
2012-01-02  8   2   3

In [95]: print df.ix[d1:d2].swaplevel(0,1).ix[['AAPL', 'MSFT']]
<blah balh>
TypeError: Expected tuple, got str

我想避免建立一个长元组列表,即:

t = [(d1, 'AAPL'), (d1, 'MSFT'), (d2, 'AAPL'), (d2, 'MSFT')]

传递给ix时可以正常工作。以下是我想要的输出。

In [103]: print df.ix[t]
                 f1  f2  c1
date       sym
2012-01-01 AAPL  5   2   3
           MSFT  4   2   3
2012-01-02 AAPL  8   2   3
           MSFT  7   2   3

谢谢, 约翰

1 个答案:

答案 0 :(得分:3)

它适用于我的熊猫0.7.2:

print df.ix[d1:d2].swaplevel(0,1).ix[['AAPL', 'MSFT']]
                 f1  f2  c1
sym  date                  
AAPL 2012-01-01   5   2   3
MSFT 2012-01-01   4   2   3
AAPL 2012-01-02   8   2   3
MSFT 2012-01-02   7   2   3

import pandas; pandas.__version__
'0.7.2'