PCA和Hotelling的T ^ 2用于R中的置信度

时间:2017-03-07 00:04:39

标签: r statistics

我进行了主成分分析并获得了第一个主要成分。我根据2台电脑的得分制作了我的积分图表。我想在此图上添加一个对应于Hotelling的T ^ 2测试的95%置信区域,以便检测椭圆外的点(异常值) R怎么可能? 你有什么例子吗?

我会做这样的事情并检测椭圆中的点:

enter image description here

2 个答案:

答案 0 :(得分:0)

我们可以使用veganggbiplot绘制PCA的置信椭圆,如下所示:

set.seed(1)
data <- matrix(rnorm(500), ncol=5) # some random data
data <- setNames(as.data.frame(rbind(data, matrix(runif(25, 5, 10), ncol=5))), LETTERS[1:5]) # add some outliers
class <- sample(c(0,3,6,8), 105, replace=TRUE) # 4 groups

library(vegan)
PC <- rda(data, scale=TRUE)
pca_scores <- scores(PC, choices=c(1,2))
plot(pca_scores$sites[,1], pca_scores$sites[,2],
     pch=class, col=class, xlim=c(-2,2), ylim=c(-2,2))
arrows(0,0,pca_scores$species[,1],pca_scores$species[,2],lwd=1,length=0.2)
ordiellipse(PC,class,conf=0.95)

enter image description here

library(ggbiplot)
PC <- prcomp(data, scale = TRUE)
ggbiplot(PC, obs.scale = 1, var.scale = 1, groups = as.factor(class), ellipse = TRUE, 
                                                    ellipse.prob = 0.95)

enter image description here

答案 1 :(得分:0)

pcaMethods程序包具有一个function simpleEllipse(x, y, alpha, len)来执行此操作。给定两个不相关的数据向量,它将返回一个椭圆,该椭圆根据每个得分的方差和F统计量对轴进行缩放。