我一直在玩lightfm很长一段时间,并发现生成推荐非常有用。但是,我想知道两个主要问题。
在建议的排名重要的情况下评估LightFM模型,我是否应该更多地依赖precision@k
或其他提供的评估指标,例如AUC score
?在哪些情况下,与其他指标相比,我应该专注于改进precision@k
?或者他们高度相关?这意味着如果我设法提高我的precision@k
分数,其他指标将会跟随,我是否正确?
如果使用WARP
损失函数训练的模型对precision@5
得分为0.089,您会如何解释? AFAIK,Precision at 5告诉我前5个结果中有多少比例为正/相关。这意味着如果我的预测无法达到前5,我将得到0 precision@5
如果我在前5中只有一个预测正确,我将得到0.2但是我无法解释0.0xx对于{{1 }}
由于
答案 0 :(得分:13)
Precision @ K和AUC测量不同的东西,并为您提供有关模型质量的不同视角。一般来说,它们应该是相关的,但了解它们的不同之处可能有助于您选择对您的应用更重要的那个。
另请注意,虽然AUC指标的最大值为1.0,但最大可达到的精度@ K取决于您的数据。例如,如果您测量精度@ 5但只有一个正项,则您可以达到的最高分数为0.2。
在LightFM中,AUC和precision @ K例程返回度量标准得分数组:一个用于测试数据中的每个用户。最有可能的是,你平均这些得到平均AUC或平均精度@K得分:如果你的一些用户在精度@5指标上得分为0,那么你的平均精度@ 5可能在0到0.2之间。 / p>
希望这有帮助!