根据列信息计算数据框的统计信息

时间:2018-08-12 21:15:30

标签: python-3.x pandas

有一个数据框如下所示,它仅显示4条记录

Identification      cost              weekdays
1001                $20.02            Tuesday
1002                $30.03             Monday
1004                $20.05            Wednesday
1006                $10.05            Tuesday

在熊猫中,如何计算统计数据,例如每个工作日的均值,成本标准差。我应该使用groupby,以及如何在这种情况下使用它吗?

1 个答案:

答案 0 :(得分:0)

这可能包含两部分,首先将会计类型数据转换为数字,然后将groupbyagg

df.cost=df.cost.replace( '[\$,]','', regex=True ).astype('float')
df.groupby('weekdays').cost.agg(['mean','std'])
Out[958]: 
             mean       std
weekdays                   
Monday     30.030       NaN
Tuesday    15.035  7.049855
Wednesday  20.050       NaN