在决策树中,如果我的节点具有多个分支,应该使用什么日志库?

时间:2018-10-03 16:51:21

标签: algorithm statistics random-forest decision-tree entropy

以下问题使我非常困惑。可以帮我吗?(最好是找到一些学术参考。)

我们通常使用base-2对数函数来计算决策树中的熵,这是因为大多数节点仅允许二进制分支吗?

如果我想要一个具有许多分支的节点,log2在理论上仍然有效吗?

例如,在Xgboost中,训练集输入应采用矩阵形式,我认为这意味着我们只能将数值作为输入。

非常感谢您!

1 个答案:

答案 0 :(得分:1)

对数的基数2几乎可以肯定是因为我们喜欢以位为单位来测量熵。这只是一个约定,有些人使用基数e(用nat代替位)。

我不能谈论Xgboost,但是对于离散决策问题,熵作为一种性能指标而发挥作用,而不是直接由于树结构而产生。您可以仅根据熵的定义来计算任何拆分的信息增益(使用任何分支因子)。

如果您正在寻找一本有关信息论和概率的书,我强烈推荐MacKay(提供完整的PDF)。他涵盖了相当多的机器学习和统计知识。但是,决策树并未涵盖。