我想知道是否有来源,在给出一些列车数据和测试数据的情况下,还提供了推荐系统评估的测试统计数据。例如,给定两个文件train.dat和test.dat,其中数据已经被分成训练和测试集,其中包含user_id,item_id和评级(就像在grouplens数据集中一样),最后得到一些精度答案或召回或映射@k测试用于表现非个性化推荐系统(如评价最高的项目 - 最常见的)或任何其他推荐系统。
提前谢谢你,
此致
马里奥斯
答案 0 :(得分:0)
了解已知推荐人在新数据集上的表现如何获取现有实施并运行它的最快方法。如果您准备好拆分 - 没关系,但要确保拆分策略足以满足您的要求。
有用的评估项目: - librec - 项目竞争对手 - MediaLens
并确保正确的措施用于正确的目的。在问题中给出评级预测示例,然后列出排名评估测量。