做预测时是否有必要将因子变量转换为数值?

时间:2018-12-30 10:44:12

标签: r

我有一个数据,其中2个变量是因子变量。第一个是“频率”,它有4个值-Mly,Qly。 Hly和Yly。第二个是Type,其值如Trad,Ulip,Term和Pension。是否建议将这些变量转换为数值,例如将值1分配给4并进行预测?

我是数据科学的新手,因此是一个问题

1 个答案:

答案 0 :(得分:1)

我认为您最好保留类别变量,不要将其转换为数值形式。例如,R中的回归包能够正确管理因子变量(即使没有定义虚拟变量)。此外,当您进行逻辑回归时,响应变量必须是分类的。