有一个数据框如下所示,它仅显示4条记录
Identification cost weekdays
1001 $20.02 Tuesday
1002 $30.03 Monday
1004 $20.05 Wednesday
1006 $10.05 Tuesday
在熊猫中,如何计算统计数据,例如每个工作日的均值,成本标准差。我应该使用groupby,以及如何在这种情况下使用它吗?
答案 0 :(得分:0)
这可能包含两部分,首先将会计类型数据转换为数字,然后将groupby
与agg
df.cost=df.cost.replace( '[\$,]','', regex=True ).astype('float')
df.groupby('weekdays').cost.agg(['mean','std'])
Out[958]:
mean std
weekdays
Monday 30.030 NaN
Tuesday 15.035 7.049855
Wednesday 20.050 NaN