我试图改进项目中的mahout推荐实现,并且我发现我的前任使用tanimotoCoefficientSimilarity用于优先级值为1-5的数据集。我把它改成了UncenteredCosineSimilarity,现在我试图测试它在性能方面的改进。
我尝试在两者上使用AverageAbsoluteDifferenceEvaluator,但意识到这不应该用于Tanimoto,因为它不会返回首选项的预期值。
但是,这个值似乎很奇怪,我不太清楚这个实现返回的值是什么。数据集的平均优先级值为3.2,如果Tanimoto要返回[0,1]范围内的值,则AverageAbsoluteDifferenceEvaluator的输出必须在[2.2,3.2]范围内,但它始终返回一个值范围[0.8,1.1]。
有没有人对此有解释?
谢谢。
答案 0 :(得分:0)
TanimotoCoefficientSimilarity在没有系数的情况下工作 - 所以AverageAbsoluteDifferenceEvaluator对TanimotoCoefficientSimilarity没有任何意义