我的任务是按照质量对项目进行排名,但是,训练集中的标签quality
不是排名编号,而是二进制数字,描述此项目是好项目还是坏项目:< / p>
>>> trainset=pd.DataFrame({"f1":[44,67,81],"f2":[0.5,0.7,0.1],"quality":[0,1,1]})
>>> trainset
f1 f2 quality
0 44 0.5 0
1 67 0.7 1
2 81 0.1 1
我尝试过使用逻辑回归和gbdt来预测十进制预测及其排名,但性能不好。也许是因为GLM
和GBDT
试图最小化prediction
和ground_true_label
之间的对数丢失,这在排名任务中是不相关的。< / p>
有人知道任何模型或算法可能适合我的情况吗?