标签: analytics random-forest decision-tree data-science
我是数据科学的新手,目前正在尝试学习和理解决策树算法。当我们在分类问题中有一些连续变量和在回归问题中有分类变量时,我有一个关于算法如何工作的问题。
通常算法基于分类问题中的基尼指数和回归问题中的方差减少技术。
但是当涉及在分类问题中处理连续变量时,算法如何考虑连续变量,在选择最佳分裂(具有最高基尼指数)时。 - 回归问题反之亦然
提前致谢:)