我正在尝试构建一个我必须在固定训练和测试集上离线使用的推荐系统,并且我必须使用精度指标进行评估。每个用户都给出了一些评级(1-5个值),因此我在用户评级矩阵中没有空行。我必须为测试集中的用户推荐项目,所有这些项目也存在于训练集中,并且我必须针对精度度量(特别是MAP @ 5,平均精度)优化算法。根据他的经验,有人可以给我一个关于我应该使用的算法的建议吗?如果我应该使用特定的工具/库或特定的编程语言,也许我应该如何实现它。
答案 0 :(得分:0)
这可能有点晚了,但是我正在和Mahout做一个类似的任务(如果我理解你的话),到目前为止,那么好。 关于MAP(这实际上是我偶然发现你的问题的原因):据我所知,这不是Mahout的开箱即用功能。你可能想看看Myrrix(例如this),我看到了几个提到这个的帖子。但我必须警告你,我自己没有尝试过......