我看到有人为名称变量创建虚拟变量,用于分类问题的机器学习模型。然后在决策树,SVM,NN模型中使用原始名义变量和新创建的虚拟变量。
我没有看到它的重点。我觉得使用名义变量及其派生的虚拟变量是多余的。
我是否正确或是否有必要同时使用原始名义变量及其虚拟指标?
答案 0 :(得分:0)
取决于您正在训练的模型。简单模型(如线性模型)可能过于“愚蠢”,无法“看到”派生特征与原始特征的关系。
在线性回归的情况下,引入一个另一个方形的新特征足以“欺骗”模型;它只能“看到”线性关系,所以二次方看起来是独立的。