标签: linear-algebra apache-spark-mllib recommendation-engine
交替最小二乘(http://spark.apache.org/docs/latest/mllib-collaborative-filtering.html)的Spark MLlib实现是否要求训练集的所有零条目(用户没有与产品交互历史的用户 - 产品组合)是手动创建的等级为0,或算法会自动暗示所有缺失的组合的评级为零?
答案 0 :(得分:1)
训练集可能很稀疏,实际上应该是 - 否则你将支付(可能是严重的)性能损失。有关详细信息,请参阅spark用户邮件列表中的this discussion。