关于消除异常值已经有很多问题,但是我无法解决它们。
我想从AlphaColor
中删除带有异常值的行。
说,我关注dataframe
:
dataframe
对于行 0 1 2 3 4 5 6 7
a 1 2 3 4 100 2 1 3
b 2 1 3 4 1 2 300 123
c 100 200 300 400 200 500 200 400
,我们可以假设100是一个离群值,因此我想删除a
。
尽管行a
中的所有值都很高,但它们并不是行本身的异常值,因此,我想保留它。
因此,基本上我想删除所有带有异常值的行。
我尝试移调DF并进行了类似的操作
c
,但无效
答案 0 :(得分:4)
将axis=1
添加到zscore
:
df = df[(np.abs(stats.zscore(df, axis=1)) < 2).all(axis=1)]
print (df)
0 1 2 3 4 5 6 7
c 100 200 300 400 200 500 200 400