如何为决策树的连续特征选择拆分变量

时间:2019-06-01 11:32:58

标签: python machine-learning artificial-intelligence decision-tree machine-learning-model

我目前正在执行决策树算法。如果我有连续的特征数据,该如何确定分裂点。我遇到了很少的资源,据说要在每两个点之间选择中间点,但是考虑到我有8000行数据,这将非常耗时。输出/功能标签具有类别数据。有什么方法可以使我更快地执行此操作

1 个答案:

答案 0 :(得分:0)

决策树通过计算熵和信息增益来确定最重要的特征。实际上,对于决策树而言,8000行并不是太多。但通常来说,随机森林类似于决策树。它正在作为合奏。您可以查看并尝试。此外,也许慢慢地与另一件事有关。