标签: data-mining
我想问一下理论或某些东西来识别大量数据中的异常数据。
For example: Sequence data :2,2,2,3,3,3,3,5,2,2,2,3,3,7,7,3,2,... Abnormal data :5,7
答案 0 :(得分:0)
对平均值和标准差进行强大估算。
例如,中位数和MAD。
然后定义一个阈值,例如中位数+ 2 * MAD。