标签: apache-spark apache-spark-mllib collaborative-filtering
我正在使用Spark MLlib ALS功能来构建推荐系统。该函数接受包含以下形式的行的rdd作为输入:(user_id,item_id,rating)。
我想知道当函数看到两个具有相同 user_id 和 item_id 的元组时会发生什么。功能是否覆盖或平均值?
我查看了官方文档,但没有发现任何线索。
非常感谢