如何从python中的二维数组中删除离群值

时间:2020-09-29 21:21:07

标签: python outliers

我不知道如何从二维数据中删除异常值。 例如,我有:

import numpy as np

x = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
y = np.array([1, 2, 3, 4, 5, 1, 7, 8, 2, 10])

plt.xlabel("time")
plt.ylabel("value")

plt.scatter(x, y, color = "g", marker = "o") 

enter image description here

如您所见,离群点是位于X的第5位和第8位的点。

如何找到它们并在python中将其删除?

重要

这只是示例数据。如果您想帮助我,请提供有关如何处理此类问题的一般性答复。 IQR似乎不能解决该问题。

1 个答案:

答案 0 :(得分:-1)

这通常是通过计算数据集中每个点的标准偏差,然后选择一个偏差值来完成的,超出该值您将用该值抛出数据点。

您正在使用numpy。我不确定,但是我希望numpy模块能够在一组数据点上计算标准偏差。 Check this out.