如何解释findCorrelation()函数的结果?

时间:2016-12-08 06:02:09

标签: r correlation r-caret feature-selection

我遇到了findCorrelation()函数的问题,这是我的输入和输出。

>findCorrelation(cor(subset(segdata, select=-c(56))),cutoff=0.9)
[1] 16 17 14 15 30 51 31 25 40
>cor(segdata)[c(16,17,14,15,30,51,31,25,40),c(16,17,14,15,30,51,31,25,40)]

enter image description here

我删除了56列,因为这是因子变量。

在代码之上,我使用cutoff = 0.9。它意味着只打印那些相关性大于或等于0.9的变量。 但是,在结果图像文件中,结束变量(P12002900)具有非常低的相关性。当我使用" cutoff = 0.9"时,不应输出低相关性,例如P12002900。 为什么要印这个?

所以我使用了R中提供的Vehicle bigdata。

>library(mlbench)
>library(caret)
>data(Vehicle)
>findCorrelation(cor(subset(Vehicle,select=-c(Class))),cutoff=0.9)
[1]3 8 11 7 9 2
>cor(subset(Vehicle,select=-c(Class)))[c(3,8,11,7,9,2),c(3,8,11,7,9,2)]

这是结果图像。 enter image description here

最后一个变量(Circ)的相关性低于0.9。 但它被印刷....

请帮帮我...谢谢你的帮助!

0 个答案:

没有答案