我有一个包含3个变量的167个观察数据集。我正在尝试使用强大的Mahalanobis距离来评估和消除多变量异常值。为此,我一直在使用Moutlier
包中的chemometrics
函数。
我对R很新,所以我有一些问题:
这是我的代码:
data<-isotopes
x=data[,c(3:5)] #columns 3-5 contain the data I need to assess
require(robustbase)
res <- Moutlier(data[,c(3:5)] ,quantile=0.975,plot=TRUE)
res
which(res$rd>res$cutoff)
1)之前是否有人使用过此代码,我是否正确完成了此操作?
2)在执行此功能之前是否需要标准化数据,还是无关紧要?
3)使用which
函数后,结果为:
# [1] 13 28 29 47 79 84 89 91 104 128 153 154
这是否意味着这些数字对应于观察#13,#28,#29等? 对于所有3个变量,那些是我要删除的异常值?
非常感谢能够提供帮助的任何人......