应用错误收集

我的任务是按照质量对项目进行排名，但是，训练集中的标签quality不是排名编号，而是二进制数字，描述此项目是好项目还是坏项目：< / p>

>>> trainset=pd.DataFrame({"f1":[44,67,81],"f2":[0.5,0.7,0.1],"quality":[0,1,1]})
>>> trainset
   f1   f2  quality
0  44  0.5        0
1  67  0.7        1
2  81  0.1        1

我尝试过使用逻辑回归和gbdt来预测十进制预测及其排名，但性能不好。也许是因为GLM和GBDT试图最小化prediction和ground_true_label之间的对数丢失，这在排名任务中是不相关的。< / p>

有人知道任何模型或算法可能适合我的情况吗？

如何在排名任务中使用二进制分类标签

0 个答案: