R中的findCorrelation函数

时间:2017-03-21 16:16:14

标签: r correlation r-caret

我在R。

的CARET包中的findCorrelation()函数上有几个Q.

当我使用此代码时:

  correlations <- cor(list)
  highCorr <- findCorrelation(correlations, cutoff = .6, names = FALSE)
  new_list <- list[, -highCorr]
  1. 是否删除了0.6以上和-0.6以下的所有功能?
  2. 假设我有两个相关的特征,男性和女性(因为缺少值而不是全部相同),如果它们相互关联,该函数如何选择要删除哪一个?

1 个答案:

答案 0 :(得分:5)

  
      
  1. 是否删除了0.6以上和-0.6以下的所有功能?
  2.   

如果您要问的是两个变量之间的成对相关性是否大于0.6被视为与成对相关性小于-0.6相同,那么答案是肯定的。从文档:&#34;考虑成对相关的绝对值。&#34;

  
      
  1. 如果函数彼此相关,该函数如何选择要删除哪一个?
  2.   

再次来自文档:&#34;该函数查看每个变量的平均绝对相关性,并删除具有最大平均绝对相关性的变量。&#34;换句话说,它根据与所有其他变量的相关程度选择两个变量中的一个。

有关详细信息,请参阅help(findCorrelation)