特征选择技术

时间:2018-10-30 11:37:48

标签: machine-learning statistics data-science data-analysis feature-selection

我对统计建模完全陌生。我想知道什么是特征选择技术。

说我有10个变量,但我需要其中的一个真正重要的变量。

我已经阅读了有关互联网上功能选择的知识,但对其中的一些技术了解很少:

  1. 关联
  2. 转发选择
  3. 向后淘汰

但是我不知道如何使用它们。如何在特征选择中使用关联。如何执行前向选择/向后消除等

我可以使用哪些模型进行特征选择。我只想对此有一个高层次的概述。何时使用什么

有人帮助我入门

1 个答案:

答案 0 :(得分:0)

相关性-通过这种方法,我们将了解目标变量如何与预测变量相关联,并选择高度相关的变量,而忽略其他变量。

前向选择-首先,我们从0个预测变量开始,然后检查模型性能。然后,在每个阶段,我们都添加一个能提供最佳模型性能的预测变量。

向后选择-首先,我们从所有预测变量开始。然后在每个阶段,我们都会删除其中一个可提供更好模型性能的预测变量。