R中的虚拟包装

时间:2017-08-20 13:32:21

标签: r dummy-variable

有人可以帮忙吗?

我正在使用R(函数虚拟)中的虚拟包将分类变量(10个类别)转换为虚拟变量,因为我使用的一些算法(adaboost和rotation forest)不能很好地处理分类变量。

使用包后我得到10个虚拟变量,但它们是因子。我希望它们是1和0的数字。

我应该将它们转换为数字吗?或者将它们用作因子。

非常感谢!!!! 祝一切顺利 佩德罗

1 个答案:

答案 0 :(得分:0)

执行一次热编码后,将它们保持为因子或数字没有区别。最好不要为基于树的模型执行一个热编码。它会降低性能。Here is an article describing effect of one hotted variables.。最好通过将分类变量转换为因子来传递分类变量