熊猫数据框替换异常值

时间:2020-09-30 07:18:57

标签: python pandas numpy dataframe time-series

预先感谢您的帮助! (下面提供的代码)(数据Here

我想删除5 cm至225 cm列的5 / 6th标准偏差之外的异常值,并用该日期(月/日)和深度的平均值替换它们。最好的方法是什么?

static {
    SoapUI.setSoapUICore( new StandaloneSoapUICore(true) );
}

enter image description here

1 个答案:

答案 0 :(得分:0)

对于更通用的解决方案,假设您获得的数据帧为df,其中包含某些列a

from scipy import stats.
df[np.abs(stats.zscore(df['a'])) > 5]['a'] = df['a'].mean()