Apache Spark MLlib ALS。重复的用户 - 项目对

时间:2016-04-11 17:20:50

标签: apache-spark apache-spark-mllib collaborative-filtering

我正在使用Spark MLlib ALS功能来构建推荐系统。该函数接受包含以下形式的行的rdd作为输入:(user_id,item_id,rating)

我想知道当函数看到两个具有相同 user_id item_id 的元组时会发生什么。功能是否覆盖或平均值?

我查看了官方文档,但没有发现任何线索。

非常感谢

0 个答案:

没有答案