标签: catboost
我正试图了解catboost的工作原理。
我相信,在每个步骤中,基本估算值都可以按照here分配并由“ bagging_temperature”控制的随机权重拟合每个对象(行/样本?)?
我不清楚是否适用于要素(列)吗?
我问的原因是,我可以从数据中生成大量连续特征,特别是滞后温度和不同窗口上的滚动平均温度。我对此的担心是过度拟合,我是否更好地使用交叉验证来选择较小的高质量特征子集?