标签: r correlation redundancy
我想知道如何计算我的data.set的所有列之间的相关性,其中有一些数字,其中大多数是字符和整数。我的数据由6000 obs组成。 23个变量。在计算相关性之后,我还想删除冗余列,以便创建更好的data.set
答案 0 :(得分:1)
您可以在整个数据框上使用cor()函数来创建相关矩阵。 但是,根据定义,相关系数只能根据数值计算。不允许使用字符和整数值。我建议您访问统计交换网站,了解有关相关系数的更多信息。
cor()
cor(df)