我尝试通过对冒号进行过滤来删除数据集的异常值并进行均值。 我可以单独成功,但两者都失败。
df.groupby(['column_1', 'column_2', column_3', 'column_4']).quantile([0.05, 0.95])
df.groupby(['column_1', 'column_2', column_3', 'column_4']).mean()
这段代码给了我2个数据集,但是我在寻找均值之前要寻找离群值。 groupby是否可能,或者我需要手动进行操作? 如果可能的话,我可以使用哪种方法?
谢谢,如果我的英语不好,
答案 0 :(得分:0)
您需要将第一个命令的结果分配回一个新的数据帧,然后可以取其平均值:
df_temp = df.groupby(['column_1', 'column_2', 'column_3', 'column_4']).quantile([0.05, 0.95])
df_temp.groupby(['column_1', 'column_2', 'column_3', 'column_4']).mean()