在机器学习中具有太多级别的分类变量

时间:2017-04-24 11:20:39

标签: machine-learning logistic-regression

我有一个机器学习问题,其中因变量是二项式(是/否),而一些自变量是分类的(超过100个级别)。我不确定是否对这些分类变量进行虚拟编码然后将它们传递给机器学习模型是一种最佳解决方案。

有没有办法解决这个问题?

谢谢!

1 个答案:

答案 0 :(得分:0)

您可以尝试在分类变量上创建虚拟变量。在此之前,尝试组合一些分类变量。