我遇到了findCorrelation()函数的问题,这是我的输入和输出。
>findCorrelation(cor(subset(segdata, select=-c(56))),cutoff=0.9)
[1] 16 17 14 15 30 51 31 25 40
>cor(segdata)[c(16,17,14,15,30,51,31,25,40),c(16,17,14,15,30,51,31,25,40)]
我删除了56列,因为这是因子变量。
在代码之上,我使用cutoff = 0.9。它意味着只打印那些相关性大于或等于0.9的变量。 但是,在结果图像文件中,结束变量(P12002900)具有非常低的相关性。当我使用" cutoff = 0.9"时,不应输出低相关性,例如P12002900。 为什么要印这个?
所以我使用了R中提供的Vehicle bigdata。
>library(mlbench)
>library(caret)
>data(Vehicle)
>findCorrelation(cor(subset(Vehicle,select=-c(Class))),cutoff=0.9)
[1]3 8 11 7 9 2
>cor(subset(Vehicle,select=-c(Class)))[c(3,8,11,7,9,2),c(3,8,11,7,9,2)]
这是结果图像。 enter image description here
最后一个变量(Circ)的相关性低于0.9。 但它被印刷....
请帮帮我...谢谢你的帮助!