机器学习中的逐点和成对排名有什么区别

时间:2013-07-01 19:15:34

标签: machine-learning ranking ranking-functions

我一直在读关于成对排名的论文,这是我不能得到的:

逐点和成对排名之间的训练/测试数据有何不同? 这是我一直在阅读的论文: http://www.cs.cornell.edu/people/tj/publications/joachims_02c.pdf

在那里,它说对绞线排名中的数据点是两个链接之间的不平等:

[line]。=。 [两个链接之间的不等,即目标] qid:[qid] [[链接1和2的特征]:[值1和2]]#[info]

然而,

RankLib确实支持像RankNet和RankBoost这样的成对量表,但它使用它的数据点格式是逐点的

[line]。=。 [绝对排名,即目标] qid:[qid] [feature1]:[value1] [feature2]:[value2] ...#[info]

我有什么遗失的吗?

1 个答案:

答案 0 :(得分:8)

点明智排名类似于回归。每个点都有一个相关的排名分数,您希望预测该排名分数。因此,您的标记数据集将具有特征向量和给定查询的相关排名分数

IE:{d1,r1} {d2,r2} {d3,r3} {d4,r4}

其中r1> r2> r3> r4

成对排名类似于分类。每个数据点与另一个数据点相关联,并且目标是学习分类器,该分类器将预测两者中的哪一个与给定查询“更”相关。

IE:{d1> d2} {d2> d3} {d3> D4}