catboost特征图中的“不同特征值的预测”曲线是什么?

时间:2019-10-14 17:06:04

标签: catboost

我所指的情节可以在here中找到。通过调用calc_feature_statistics函数来复制它。

我很清楚蓝色和橙色曲线(平均目标和均值预测)代表什么。 红线是什么(对不同特征值的预测)?

1 个答案:

答案 0 :(得分:0)

来自链接:

  

要对其进行计算,要素的值会连续更改为落入每个输入对象的每个存储桶中。当图形的存储桶的特征值更改为属于该存储桶时,该存储桶的值将作为所有对象的平均值计算。

据我所知,这些解释如下:

例如,您具有三个可能的值的分类特征:“莫斯科”,“伦敦”,“纽约”。然后:

  1. 让我们在火车数据中将此功能的所有值都设置为“ Moscow”,然后 使用我们的模型计算所有数据之间的平均预测 训练更早。这将是存储桶的红线点 “莫斯科”

  2. 使用值“伦敦”重复上一步->这将是存储桶“伦敦”的红点

  3. 与纽约相同。