目前,我有一个数据框,其中包含月度队列的索引层次结构。以下是我对它们进行分组的方法。
grouped = dfsort.groupby(['Cohort','Lifetime_Revenue'])
cohorts = grouped.agg({'Customer_ID': pd.Series.nunique})
哪个输出:
Cohort Lifetime_Revenue Customer_ID
2014-01 149.9 1
2014-02 299.9 1
2014-03 269.91 1
329.89 1
899.88 1
2014-04 299.9 1
674.91 2
2014-05 899.88 1
2014-06 824.89 1
等等。
我希望获得每个群组的终身收入总额以及群组的总用户数。
基本上,我想把它变成一个普通的数据库。
有人对此有任何想法吗?