我使用Weka 3.7.11中的RandomForest,而后者正在装载Weka的RandomTree。我的输入属性是数字,输出属性(标签)也是数字。
训练RandomTree时,为树的每个节点随机选择K个属性。尝试了几个基于这些属性的分裂,并且最好的"一个被选中。 Weka如何确定这个(数字)案例中最好的分裂?
对于名义属性,我认为Weka正在使用基于条件熵的information gain标准。
IG(T|a) = H(T) - H(T|a)
是否有类似用于数字属性的东西?也许是差分熵?