我正在尝试按多列对行进行分组。 我想要实现的目标可以用这个小例子说明:
import pandas as pd
col_index = pd.MultiIndex.from_arrays([['A','A','B','B'],['a','b','c','d']])
df = pd.DataFrame([ [1,2,3,3],
[4,2,2,2],
[6,4,2,2],
[1,2,4,4],
[3,8,4,4],
[1,2,3,3]], columns = col_index)
由此创建的DataFrame如下所示:
A B
a b c d
0 1 2 3 3
1 4 2 2 2
2 6 4 2 2
3 1 2 4 4
4 3 8 4 4
5 1 2 3 3
我想按'c'和'd'分组,实际上整个'B' 这给了我“KeyError:'c'”
#something like this
df.groupby(['c','d'], axis = 1, level = 1)
#or like this
df.groupby('B', axis = 1, level = 0)
我试着寻找答案,但我似乎找不到任何答案。
有人可以告诉我我做错了吗?
答案 0 :(得分:1)
这是通过首先重置列来实现此目的的一种方法:
df.set_axis(df.columns.droplevel(0), axis=1,inplace=False).groupby(['c','d']).sum()
Out[531]:
a b
c d
2 2 10 6
3 3 2 4
4 4 4 10
答案 1 :(得分:0)
您还可以明确指定2级多指数。
df.groupby([("B","c"), ("B", "d")])