我有一个包含不同世界区域的数据集,并且有一个groupby参数,我不仅要包括当前输出,而且要包括每个min和max函数的关联日期:
dfmin2 = df2.groupby('Region')['Student'].agg(['sum','min','max','mean']
产生:
Region sum min max mean
Canada 5 1 3 2.5
Mexico 10 2 6 5
我想要:
Region sum min min date max max date mean
Canada 5 1 year 6 3 year 2 2.5
Mexico 10 2 year 8 6 year 9 5
其中最小日期和最大日期与最小/最大列的数字发生最小/最大时的位置有关。也就是说,我的数据集长达16年,我不希望每种情况的最小值和最大值分别为1年和16年,除非恰好是这种情况(不可能)