Question

我经常使用MultiIndex索引，并且我想迭代更高级别索引相等的组。它基本上看起来像

from random import choice
import pandas as pd
N = 100
df = pd.DataFrame([choice([1, 2, 3]) for _ in range(N)],
                  columns=["A"],
                  index=pd.MultiIndex.from_tuples([(choice("ab"), choice("cd"), choice("de")) 
                                                   for _ in range(N)]))

for idx in zip(df.index.get_level_values(0), df.index.get_level_values(1)):
    df_select = df.ix[idx]

有没有办法更整洁地进行for循环迭代？

Answer 1

使用groupby。 df_select视图的索引包含前两个级别值，但在其他方面与您的示例类似。

for idx, df_select in df.groupby(level=[0, 1]):
    ...

Answer 2

除了groupby逻辑，你可以使用lambda函数，它的优点是不必指定级别数，即它将选择除最后一级之外的所有级别：

for idx in df.index.map(lambda x: x[:-1]):
 df_select=df.ix[idx]

如何在Pandas中迭代MultiIndex级别？

2 个答案: