我正在寻找R中的一些易于使用的算法来标记(离群值或不离群值)或划分(例如7.5)离群值。意思是,我有一个包含多行的矩阵m
,我想要识别代表异常值的行与其他行相比。
m <- matrix( data = c(1,1,1,0,0,0,1,0,1), ncol = 3 )
为了说明更多,我想比较矩阵中的所有(完整)行,以发现异常值。
答案 0 :(得分:1)
这是我几年前写的一些非常简单的离群检测(使用箱图统计或数据的分位数)。
但是,如上所述,如果您能更准确地描述问题,将会有所帮助。
另外,您说要行式异常值。你的意思是说你有兴趣在一个变量中识别整行与观察(通常是这样做的)吗?如果是这样,您会想要使用某种距离指标,但您选择的指标取决于您的数据。