python移除异常值,过滤并进行均值

时间:2018-10-05 12:58:56

标签: python-3.x dataframe group-by mean outliers

我尝试通过对冒号进行过滤来删除数据集的异常值并进行均值。 我可以单独成功,但两者都失败。

df.groupby(['column_1', 'column_2',  column_3', 'column_4']).quantile([0.05, 0.95])


df.groupby(['column_1', 'column_2',  column_3', 'column_4']).mean()

这段代码给了我2个数据集,但是我在寻找均值之前要寻找离群值。 groupby是否可能,或者我需要手动进行操作? 如果可能的话,我可以使用哪种方法?

谢谢,如果我的英语不好,

1 个答案:

答案 0 :(得分:0)

您需要将第一个命令的结果分配回一个新的数据帧,然后可以取其平均值:

df_temp = df.groupby(['column_1', 'column_2',  'column_3', 'column_4']).quantile([0.05, 0.95])


df_temp.groupby(['column_1', 'column_2',  'column_3', 'column_4']).mean()