在特征相关性的背景下,我试图了解相关方法用于特征选择的含义。有人可以解释一下相关系数的以下结果是否出现,那么我应该采用该特征吗?规则是选择corrcoeff值大于0.5的特征。如果有错,请纠正我。我的计算方式是将变量归一化为零均值和1个标准差后,我使用的是Matlab的corrcoeff(target,feature)
,其中target
和feature
是向量,得到以下R
重视每种情况下提到的结果。
问题1 :corrcoeff返回NaN值-
Nan Nan
Nan 1
这是否意味着极高的相关性?
问题2 :如果根本没有线性关系,在这种情况下corrcoeff
将不起作用怎么办。如何知道不存在线性关系,在这种情况下如何进行特征选择?还有其他功能或技术吗?