协作过滤方法需要培训数据吗?

时间:2014-06-24 18:51:27

标签: machine-learning recommendation-engine

我即将开始为视频编写推荐系统,主要是基于协同过滤,因为视频元数据非常稀疏,还有一些基于内容的过滤。但是,我不确定如何处理培训数据。培训数据在推荐系统中是否具有重要意义,特别是在协作方法中?如果是这样,我该如何生成那种数据,或者我应该寻找什么类型的数据?

1 个答案:

答案 0 :(得分:0)

任何ML算法都需要数据。例如,采用Matrix Factorization方法。

它接收(不完整)费率矩阵:行表示用户,列表示项目,单元格包含特定用户评定特定项目的费率。然后通过对此矩阵进行分解,您可以获得每个用户和每个项目的潜在向量表示,从而允许您预测未来的费率。显然,具有最高费率的看不见的项目对用户来说最有趣,根据模型

基本上,矩阵分解学会预测已知用户和项目的新费率。