Catboost点击率设置

时间:2018-01-02 16:27:39

标签: python catboost

我使用catboost进行多分类任务,并使用分类数据。我正在检查ctr的默认参数,即从分类数据到数值数据的转换。据说ctr的默认值是"无"。

据我所知,这是一个可选步骤。

算法,确实在我的数据集上工作,所以我想知道它是否使用:

  • Gradient Boosting属性以了解分类数据
  • 或实际上是否使用Borders,Buckets,BinarizedTargetMeanValue,Counter
  • 中的默认方法
  • 或默认使用example avg_target =(countInclass + previous)/(totalcount +1)中给出的公式,看起来像" Buckets"

1 个答案:

答案 0 :(得分:0)

在Multiclass中,CatBoost使用Buckets方法计算ctrs。

您编写的公式是正确的。为每个类计算单独的ctr特征。这里countInClass是具有相同类别值的对象的计数,在给定一个随机排列之前具有该类值。而totalCount是给定具有任何类值的相同类别值之前的对象数。