Apache Spark ALS建议书

时间:2015-03-14 16:48:05

标签: apache-spark machine-learning apache-spark-mllib collaborative-filtering

我已经找到了一个小的ALS推荐系统程序 在使用Mllib的Apache Spark website上。当使用评级为1-5的数据集(我已使用MovieLens数据集)时,它会给出预测评级超过5的建议!在我的小测试中发现的最高值是7.4。显然,我要么误解代码的意图,要么出错了。我研究过潜在因子推荐系统,并且认为Spark Mlib ALS实现基于this one

为什么它会使得收视率高于可能的收视率?这毫无意义。

我是否误解了算法或程序存在缺陷?

0 个答案:

没有答案