在pandas Dataframe with multiindex中如何按顺序过滤?

时间:2017-03-12 13:28:04

标签: python pandas

假设以下数据框

>>> import pandas as pd
>>> L = [(1,'A',9,9), (1,'C',8,8), (1,'D',4,5),(2,'H',7,7),(2,'L',5,5)]
>>> df = pd.DataFrame.from_records(L).set_index([0,1])
>>> df
     2  3
0 1      
1 A  9  9
  C  8  8
  D  4  5
2 H  7  7
  L  5  5

我想过滤多索引第1级第n个位置的行,即过滤第一个

     2  3
0 1      
1 A  9  9
2 H  7  7

或过滤第三个

     2  3
0 1      
1 D  4  5

我怎样才能做到这一点?

1 个答案:

答案 0 :(得分:5)

在多索引DF的第一级执行分组后,您可以在GroupBy.nth的帮助下过滤行。由于n遵循基于0的索引方法,因此您需要为其提供适当的值,如下所示:

1)选择按level=0分组的第一行:

df.groupby(level=0, as_index=False).nth(0)

enter image description here

2)选择按level=0分组的第三行:

df.groupby(level=0, as_index=False).nth(2)

enter image description here