我有10个二进制变量的数据框,如下所示:
V1 V2 V3...
0 1 1
1 1 0
1 0 1
0 0 1
我需要得到相关矩阵,然后才能进行因子分析
psych::corr.test
可以计算相关矩阵的计算,但只有person
,spearman
,kendall
方法,不用于二进制数据。
那么,如何计算这个数据帧的相关矩阵?
答案 0 :(得分:0)
Correl方法适用于连续数据。 https://www.quora.com/Is-it-possible-to-calculate-correlations-between-binary-variables
你可以试试非参数方法试试http://www.cedar.buffalo.edu/papers/articles/CVPRIP03_propbina.pdf
您仍然可以实现因子分析,计算%匹配并删除变量匹配> x%。这样您就可以删除数据的维度。
答案 1 :(得分:0)
.StartsWith
答案 2 :(得分:0)
您可以在列上使用层次聚类
<块引用>hclus(x)
或者更好的是,您可以从“ward.D”、“ward.D2”、“单一”、“完整”中选择一种聚类方法... https://www.rdocumentation.org/packages/stats/versions/3.6.2/topics/hclust
另一种解决方案是将二进制矩阵可视化为热图,这是一个具有共同特征的类似变量