ALS是否需要零输入?

时间:2017-02-13 22:23:10

标签: linear-algebra apache-spark-mllib recommendation-engine

交替最小二乘(http://spark.apache.org/docs/latest/mllib-collaborative-filtering.html)的Spark MLlib实现是否要求训练集的所有零条目(用户没有与产品交互历史的用户 - 产品组合)是手动创建的等级为0,或算法会自动暗示所有缺失的组合的评级为零?

1 个答案:

答案 0 :(得分:1)

训练集可能很稀疏,实际上应该是 - 否则你将支付(可能是严重的)性能损失。有关详细信息,请参阅spark用户邮件列表中的this discussion