我正在学习功能选择。 我发现this并看到许多内核检查相关系数矩阵。 (在上面的链接中,他们介绍了3种特征选择方法,首先是包括相关系数和卡方检验的滤波方法。)
为什么我们可以使用相关系数进行特征选择?
我认为它只能表示2个变量之间的线性关系,因此它不能表示2个或更多变量组合或非线性关系的影响。
所以我想知道相关系数是否适合特征选择。 为什么以及如何使用它进行特征选择?
答案 0 :(得分:3)
你完全正确 - 相关是天真的,近乎原始的特征选择方法。因此,它有时会起作用(因为数据有时会遵循线性组合冗余),并且在许多更复杂的任务中会失败。没有"金色"回答这里。基于相关性的特征选择就像分类的逻辑回归 - 最容易尝试,但不应该期望解决任何问题。