我希望在种植简单的分类树时对每个样本进行不同的加权。我知道您可以在拟合树时指定样本权重的向量。
但是,我想知道杂质函数的数学论述与权重有什么关系。在数学公式文档中,我没有看到权重在各种杂质测量中的位置:http://scikit-learn.org/stable/modules/tree.html#mathematical-formulation
答案 0 :(得分:0)
不确定它是如何实现的,但可以轻松地将(标准化的)类或样本权重添加到Gini,Cross-Entropy等中使用的Pmk比例公式中。