我进行了主成分分析并获得了第一个主要成分。我根据2台电脑的得分制作了我的积分图表。我想在此图上添加一个对应于Hotelling的T ^ 2测试的95%置信区域,以便检测椭圆外的点(异常值) R怎么可能? 你有什么例子吗?
我会做这样的事情并检测椭圆中的点:
答案 0 :(得分:0)
我们可以使用vegan
或ggbiplot
绘制PCA的置信椭圆,如下所示:
set.seed(1)
data <- matrix(rnorm(500), ncol=5) # some random data
data <- setNames(as.data.frame(rbind(data, matrix(runif(25, 5, 10), ncol=5))), LETTERS[1:5]) # add some outliers
class <- sample(c(0,3,6,8), 105, replace=TRUE) # 4 groups
library(vegan)
PC <- rda(data, scale=TRUE)
pca_scores <- scores(PC, choices=c(1,2))
plot(pca_scores$sites[,1], pca_scores$sites[,2],
pch=class, col=class, xlim=c(-2,2), ylim=c(-2,2))
arrows(0,0,pca_scores$species[,1],pca_scores$species[,2],lwd=1,length=0.2)
ordiellipse(PC,class,conf=0.95)
library(ggbiplot)
PC <- prcomp(data, scale = TRUE)
ggbiplot(PC, obs.scale = 1, var.scale = 1, groups = as.factor(class), ellipse = TRUE,
ellipse.prob = 0.95)
答案 1 :(得分:0)
pcaMethods程序包具有一个function simpleEllipse(x, y, alpha, len)
来执行此操作。给定两个不相关的数据向量,它将返回一个椭圆,该椭圆根据每个得分的方差和F统计量对轴进行缩放。