应用错误收集

基于项目的相似度量

时间：2014-11-25 02:55:32

标签： mahout similarity euclidean-distance pearson

我正在使用Mahout Apache编写基于项目的推荐器（基于用户的类似项目评级），我想知道以下哪两个相似性指标最适合使用：

Pearson，Spearman，Euclidean，Tanimoto和Loglikelihood

1 个答案:

答案 0 :(得分：0)

如果您有偏好值，则应使用人物关联或欧几里德距离相似度量标准。如果您没有偏好值，则应使用Tanimoto系数或Loglikelihood。要选择要使用的缩小范围，应对数据集执行评估。这就是使用mahout评估框架的原因。您可以评估许多指标，如均方误差（MSE），绝对均方误差，精度，召回，MAP ......

我编码了调整余弦相似度，Pearson相关的变体可以得到更好的结果，但速度较慢。

离散相似度量的算法
基于项目的相似度量
局部纹理相似度的度量
计算字母（符号）空间相似度量
测试项目项目相似性的指标是什么？
基于内容的电影相似度指标
3D直方图的相似性度量
公制学习与相似性学习
基于余弦相似度的项目建议
余弦相似度学习

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？