我一直在读关于成对排名的论文,这是我不能得到的:
逐点和成对排名之间的训练/测试数据有何不同? 这是我一直在阅读的论文: http://www.cs.cornell.edu/people/tj/publications/joachims_02c.pdf
在那里,它说对绞线排名中的数据点是两个链接之间的不平等:
[line]。=。 [两个链接之间的不等,即目标] qid:[qid] [[链接1和2的特征]:[值1和2]]#[info]
然而,RankLib确实支持像RankNet和RankBoost这样的成对量表,但它使用它的数据点格式是逐点的
[line]。=。 [绝对排名,即目标] qid:[qid] [feature1]:[value1] [feature2]:[value2] ...#[info]
我有什么遗失的吗?
答案 0 :(得分:8)
点明智排名类似于回归。每个点都有一个相关的排名分数,您希望预测该排名分数。因此,您的标记数据集将具有特征向量和给定查询的相关排名分数
IE:{d1,r1} {d2,r2} {d3,r3} {d4,r4}
其中r1> r2> r3> r4
成对排名类似于分类。每个数据点与另一个数据点相关联,并且目标是学习分类器,该分类器将预测两者中的哪一个与给定查询“更”相关。
IE:{d1> d2} {d2> d3} {d3> D4}