Pandas Groupby Agg函数中的列顺序

时间:2014-11-14 21:04:25

标签: python pandas

是否有一种自动方式来维护返回的数据帧的列('C','B','A')的顺序?

g = df.groupby(['people'])
g['people'].agg({'C' : len,
                 'B' : len,
                 'A' : len,
                })

这会将列返回为A,B,C而不是C,B,A。

我只能找到示例,但不能找到agg函数本身的文档。

这似乎是一种解决方法:

g = df.groupby(['people'])
g['people'].agg({'C' : len,
                 'B' : len,
                 'A' : len,
                }).reindex_axis(['C','B','A'], axis=1)

2 个答案:

答案 0 :(得分:14)

OrderedDict令人惊讶地使用pandas-0.18.0-py2.7:

from collections import OrderedDict
g = df.groupby(['people'])
g['people'].agg( OrderedDict([
                 ('C' , len),
                 ('B' , len),
                 ('A' , len),
                ]) )

答案 1 :(得分:3)

您可以使用一些索引技巧按照您想要的顺序获取列:

g = df.groupby(['people'])
col_order = ['C', 'B', 'A']
agg_fnxs = [len, len, len]
agg_dict = dict(zip(col_rder, agg_fnxs))
g['people'].agg(agg_dict)[col_corder]