如何在不按变量分组的情况下输出摘要统计信息?

时间:2016-01-06 17:51:23

标签: python numpy pandas

python panda中,如何在没有按变量分组的情况下将摘要统计信息输出到数据框中?

这是我的数据集“Table1”:

    email         Total_Orders    Amount
    a@gmail.com   5               150
    b@gmail.com    
    c@gmail.com   4               69
    d@gmail.com   2               30

我想要的输出是:

   num_emails  total_purchasers  total_orders   total amount
   4           3                 11              249       

如果我有一个“分组依据”变量,这就是我要做的 -

    Table2 = DataFrame(Table1.groupby(['category']).agg({'emails': 'count', 'total_orders': 'count', 'total_orders': np.sum, 'Amount': np.sum})).reset_index()

但我没有变量组,所以我该怎么做?

1 个答案:

答案 0 :(得分:1)

您无法使用groupby(),因为没有密钥。相反,只需汇总所有内容:

pd.DataFrame({'num_emails':[Table1.email.count()],
              'total_purchasers':[Table1.Total_Orders.count()],
              'total_orders':[np.sum(Table1.Total_Orders)],
              'total_amount':[np.sum(Table1.Amount)]})

结果如下:

   num_emails  total_amount  total_orders  total_purchasers
0           4           249            11                 3