应用错误收集

Mahout项目相似度 - maxPrefs参数

时间：2014-12-12 14:35:46

标签： mahout mahout-recommender

在itemsimilarity中，metod tere是一个参数，如：

- maxPrefs（-mppu）maxPrefs - 最大数量偏好考虑每个用户或项目，用户或项目有更多的偏好将被抽样（默认值：500）

它是如何工作的？如果我有5百万用户和5000个项目并且我使用默认的maxPrefs运行项目相似性，那么它只考虑500万个等级中的500个或者什么？是抽样吗？如何强制计算所有输入数据？

定义中的“或”含义是什么： “每个用户或项目要考虑的最大偏好数”

1 个答案:

答案 0 :(得分：1)

这可以在邮件列表中找到：http://article.gmane.org/gmane.comp.apache.mahout.user/20827/match=

基本上，几种形式的下采样恰好保持高质量，同时将运行时间保持为O（n）执行时间。

将--maxPrefs（-mppu）maxPrefs更改为4000或最高整数值以包含所有。