如何从大量数据中识别异常数据?

时间:2017-08-17 02:07:56

标签: data-mining

我想问一下理论或某些东西来识别大量数据中的异常数据。

For example:
Sequence data :2,2,2,3,3,3,3,5,2,2,2,3,3,7,7,3,2,...
Abnormal data :5,7

1 个答案:

答案 0 :(得分:0)

对平均值和标准差进行强大估算。

例如,中位数和MAD。

然后定义一个阈值,例如中位数+ 2 * MAD。