使用布尔数据从Mahout推荐器获得连续刻度的分数

时间:2014-11-18 18:31:45

标签: mahout similarity mahout-recommender

我有一个有向图表示为(跟随者,跟随),并希望尝试使用Mahout来获取图表中新边缘的建议(也就是预测可能被跟踪的新用户)。 这是我开始的代码:

mahout recommenditembased --input input.txt --output output.txt -s SIMILARITY_TANIMOTO_COEFFICIENT --booleanData -n 2

这似乎产生了一个输出,其中所有推荐得到相同的分数:

2 [4:1.0,3:1.0]
3 [2:1.0]
...

有没有办法连续获得推荐分数,以便我可以根据分数对跟随者的推荐进行排名?我应该尝试不同的相似性指标吗?

1 个答案:

答案 0 :(得分:1)

这应该给出0到1之间的加权结果进行排序,这样你的结果排名都非常高。尝试SIMILARITY_LOGLIKELIHOOD,它几乎普遍更好,并提供不同类型的权重,仍然标准化为0到1之间。