标签: apache-spark machine-learning apache-spark-mllib collaborative-filtering
我已经找到了一个小的ALS推荐系统程序 在使用Mllib的Apache Spark website上。当使用评级为1-5的数据集(我已使用MovieLens数据集)时,它会给出预测评级超过5的建议!在我的小测试中发现的最高值是7.4。显然,我要么误解代码的意图,要么出错了。我研究过潜在因子推荐系统,并且认为Spark Mlib ALS实现基于this one。
为什么它会使得收视率高于可能的收视率?这毫无意义。
我是否误解了算法或程序存在缺陷?