有人可以帮忙吗?
我正在使用R(函数虚拟)中的虚拟包将分类变量(10个类别)转换为虚拟变量,因为我使用的一些算法(adaboost和rotation forest)不能很好地处理分类变量。
使用包后我得到10个虚拟变量,但它们是因子。我希望它们是1和0的数字。
我应该将它们转换为数字吗?或者将它们用作因子。
非常感谢!!!! 祝一切顺利 佩德罗
答案 0 :(得分:0)
执行一次热编码后,将它们保持为因子或数字没有区别。最好不要为基于树的模型执行一个热编码。它会降低性能。Here is an article describing effect of one hotted variables.。最好通过将分类变量转换为因子来传递分类变量