我有这个脚本,它对变量数进行简单的PCA分析,最后将两个坐标和另外两个列(在线,NZ_Field)连接到输出文件。我以前做了很多次,但现在它给了我这个错误:
据我所知,这意味着存在负特征值。我看了类似的帖子,建议使用na.omit,但它没有用。 我在这里上传了“biodata.Rdata”文件:
协方差矩阵不是非负定的
https://www.dropbox.com/s/1ex2z72lilxe16l/biodata.rdata?dl=0
我很确定这不是因为数据中缺少值,因为我使用了与“presence”和“NZ_Field”列不同的相同数据。
非常感谢任何帮助。
load("biodata.rdata")
#save data separately
coords=biodata[,1:2]
biovars=biodata[,3:21]
presence=biodata[,22]
NZ_Field=biodata[,23]
#Do PCA
bpc=princomp(biovars ,cor=TRUE)
#re-attach data with auxiliary data..coordinates, presence and NZ location data
PCresults=cbind(coords, bpc$scores[,1:3], presence, NZ_Field)
write.table(PCresults,file= "hlb_pca_all.txt", sep= ",",row.names=FALSE)
答案 0 :(得分:0)
这似乎是缺少数据的问题,因此有几种方法可以解决它。一种方法是在运行PCA之前手动对数据进行逐列删除,在您的情况下将是:
biovars<-biovars[complete.cases(biovars),]
另一种选择是使用另一个包,特别是psych
似乎在这里运行良好,你可以使用principal(biovars)
,虽然输出有点不同,但它确实可以使用成对删除,所以基本上它归结为您是否要使用成对或列表删除。谢谢!