一位同事和我无法就GBrank模型(培训后)的样子达成共识。
简介
该方法首先执行从成对数据集到逐点数据集的典型转换,其中目标变量 z 现在表示应该更高的分数, z i > z j 当 i 优先于 j 时。然后作者建议使用Gradient Boosting Trees,并“惩罚”该模型预测 z j >的情况。 z j 和 i 优先于 j 。 “惩罚”是通过切换分数并递增或递减τ来执行的。
歧异
我们不同意的是Gradient Boosting Rank是否本身就是一个整体。也就是说,我们正在训练的模型是 g k 还是 h k ?
参考资料
答案 0 :(得分:1)
h 在整篇论文中用来表示你正在使用的假设, g 只是一个用于构建 h的领域特定的回归模型,因此GBRank是 h k 。特别是,它是一种提升方法,因此它必须是一个整体,通过从一群弱学习者建立一个强大的学习者(从80年代末由Kearns和Valiant提出的助推定义)训练 - h 是一个集合(由于循环定义), g 不是(因为它只是在一些变换数据集上训练的回归量)。