标签: python machine-learning encoding decision-tree lightgbm
LightGBM支持分类变量。我想知道它是如何编码的。它似乎不是一个热门编码,因为算法非常快(我尝试使用花费大量时间进行一次热编码的数据)。
答案 0 :(得分:0)
https://github.com/Microsoft/LightGBM/issues/699#issue-243313657
基本思想是根据直方图的累加值(sum_gradient / sum_hessian)对直方图进行排序,然后像数字特征一样在排序后的直方图中找到最佳分割。