我有一个有向图表示为(跟随者,跟随),并希望尝试使用Mahout来获取图表中新边缘的建议(也就是预测可能被跟踪的新用户)。 这是我开始的代码:
mahout recommenditembased --input input.txt --output output.txt -s SIMILARITY_TANIMOTO_COEFFICIENT --booleanData -n 2
这似乎产生了一个输出,其中所有推荐得到相同的分数:
2 [4:1.0,3:1.0]
3 [2:1.0]
...
有没有办法连续获得推荐分数,以便我可以根据分数对跟随者的推荐进行排名?我应该尝试不同的相似性指标吗?
答案 0 :(得分:1)
这应该给出0到1之间的加权结果进行排序,这样你的结果排名都非常高。尝试SIMILARITY_LOGLIKELIHOOD,它几乎普遍更好,并提供不同类型的权重,仍然标准化为0到1之间。