在python
panda
中,如何在没有按变量分组的情况下将摘要统计信息输出到数据框中?
这是我的数据集“Table1”:
email Total_Orders Amount
a@gmail.com 5 150
b@gmail.com
c@gmail.com 4 69
d@gmail.com 2 30
我想要的输出是:
num_emails total_purchasers total_orders total amount
4 3 11 249
如果我有一个“分组依据”变量,这就是我要做的 -
Table2 = DataFrame(Table1.groupby(['category']).agg({'emails': 'count', 'total_orders': 'count', 'total_orders': np.sum, 'Amount': np.sum})).reset_index()
但我没有变量组,所以我该怎么做?
答案 0 :(得分:1)
您无法使用groupby()
,因为没有密钥。相反,只需汇总所有内容:
pd.DataFrame({'num_emails':[Table1.email.count()],
'total_purchasers':[Table1.Total_Orders.count()],
'total_orders':[np.sum(Table1.Total_Orders)],
'total_amount':[np.sum(Table1.Amount)]})
结果如下:
num_emails total_amount total_orders total_purchasers
0 4 249 11 3