我们是否应该在ML模型中使用名义变量及其派生的虚拟变量进行预测

时间:2013-11-08 04:01:15

标签: machine-learning

我看到有人为名称变量创建虚拟变量,用于分类问题的机器学习模型。然后在决策树,SVM,NN模型中使用原始名义变量和新创建的虚拟变量。

我没有看到它的重点。我觉得使用名义变量及其派生的虚拟变量是多余的。

我是否正确或是否有必要同时使用原始名义变量及其虚拟指标?

1 个答案:

答案 0 :(得分:0)

取决于您正在训练的模型。简单模型(如线性模型)可能过于“愚蠢”,无法“看到”派生特征与原始特征的关系。

在线性回归的情况下,引入一个另一个方形的新特征足以“欺骗”模型;它只能“看到”线性关系,所以二次方看起来是独立的。