我正在为一个包含85个变量的超大型数据库创建一个相关矩阵。我的数据包含缺失值。
到目前为止,我已经分析了整个数据库,您是否建议将其细分为较小的部分?还是这样做,缺失的值会影响结果?
corrtest<-round(cor(TEST, method=c("spearman"), use="complete.obs"), 2)
这是我使用的代码,然后我使用以下代码保存了数据:
write.csv(corrtest, "correlation.csv")
但是我也想看看我是否有任何显着相关性,所以我跑了
corrtest1<-rcorr(as.matrix(TEST), type = "spearman")
然后再次保存我的数据:
write.csv(corrtest1$P, "pvalue.csv")
当我检查两个矩阵时,我看不到值的明显重叠(例如,有时r值0.3
的p值非常低)。正常吗
我以错误的方式处理此问题吗?
非常感谢您的帮助!