我不知道如何从二维数据中删除异常值。 例如,我有:
import numpy as np
x = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
y = np.array([1, 2, 3, 4, 5, 1, 7, 8, 2, 10])
plt.xlabel("time")
plt.ylabel("value")
plt.scatter(x, y, color = "g", marker = "o")
如您所见,离群点是位于X的第5位和第8位的点。
如何找到它们并在python中将其删除?
重要
这只是示例数据。如果您想帮助我,请提供有关如何处理此类问题的一般性答复。 IQR似乎不能解决该问题。
答案 0 :(得分:-1)
这通常是通过计算数据集中每个点的标准偏差,然后选择一个偏差值来完成的,超出该值您将用该值抛出数据点。
您正在使用numpy
。我不确定,但是我希望numpy
模块能够在一组数据点上计算标准偏差。 Check this out.