使用多个函数在groupby.agg中传递参数

时间:2018-02-17 17:20:16

标签: python pandas group-by aggregate

任何人都知道如何使用多个函数在groupby.agg()中传递参数?

最重要的是,我想将它与自定义函数一起使用,但我会使用需要参数的内置函数来提问我的问题。

假设:

import pandas as pd
import numpy as np
import datetime
np.random.seed(15)
day = datetime.date.today()
day_1 = datetime.date.today() - datetime.timedelta(1)
day_2 = datetime.date.today() - datetime.timedelta(2)
day_3 = datetime.date.today() - datetime.timedelta(3)
ticker_date = [('fi', day), ('fi', day_1), ('fi', day_2), ('fi', day_3),
               ('di', day), ('di', day_1), ('di', day_2), ('di', day_3)]
index_df = pd.MultiIndex.from_tuples(ticker_date, names=['lvl_1', 'lvl_2'])
df = pd.DataFrame(np.random.rand(8), index_df, ['value'])

我该怎么做:

df.groupby('lvl_1').agg(['min','max','quantile'])

,作为'分位数'的参数:

q = 0.22 

2 个答案:

答案 0 :(得分:10)

使用lambda功能:

q = 0.22
df1 = df.groupby('lvl_1')['value'].agg(['min','max',lambda x: x.quantile(q)])
print (df1)
            min       max  <lambda>
lvl_1                              
di     0.275401  0.530000  0.294589
fi     0.054363  0.848818  0.136555

或者可以创建f函数并为自定义列名设置名称:

q = 0.22
f = lambda x: x.quantile(q)
f.__name__ = 'custom_quantile'
df1 = df.groupby('lvl_1')['value'].agg(['min','max',f])
print (df1)
            min       max  custom_quantile
lvl_1                                     
di     0.275401  0.530000         0.294589
fi     0.054363  0.848818         0.136555

答案 1 :(得分:0)

df1 = df.groupby('lvl_1')['value'].agg(['min','max',("custom_quantile",lambda x: x.quantile(q))])

对于q = 0.22,输出为:

       min      max         custom_quantile
lvl_1           
di     0.275401 0.530000    0.294589
fi     0.054363 0.848818    0.136555