Question

假设以下数据框

>>> import pandas as pd
>>> L = [(1,'A',9,9), (1,'C',8,8), (1,'D',4,5),(2,'H',7,7),(2,'L',5,5)]
>>> df = pd.DataFrame.from_records(L).set_index([0,1])
>>> df
     2  3
0 1      
1 A  9  9
  C  8  8
  D  4  5
2 H  7  7
  L  5  5

我想过滤多索引第1级第n个位置的行，即过滤第一个

或过滤第三个

     2  3
0 1      
1 D  4  5

我怎样才能做到这一点？

Answer 1

在多索引DF的第一级执行分组后，您可以在GroupBy.nth的帮助下过滤行。由于n遵循基于0的索引方法，因此您需要为其提供适当的值，如下所示：

1）选择按level=0分组的第一行：

df.groupby(level=0, as_index=False).nth(0)

2）选择按level=0分组的第三行：

df.groupby(level=0, as_index=False).nth(2)

在pandas Dataframe with multiindex中如何按顺序过滤？

1 个答案: