协同过滤 - 矩阵分解与皮尔逊相关

时间:2016-04-29 11:00:09

标签: machine-learning recommendation-engine collaborative-filtering matrix-factorization pearson-correlation

对于推荐引擎,这些技术的优点和缺点是什么(矩阵分解:ALS,皮尔逊或cossin相关性)以及我们如何使用哪种技术。

1 个答案:

答案 0 :(得分:3)

使用皮尔逊相关的协同过滤存在一些问题。我将列出几个大的:

  • 可伸缩性
    当您的数据库增长时,计算用户之间的皮尔森相关性将花费更长的时间。由于您必须计算每个用户之间的相关性,因此这将呈指数级增长。

  • 数据稀疏性
    对于大多数推荐引擎来说,这是一个大问题。如果您有很多用户和很多带有一些评论的项目,那么生成建议将变得很困难,因为您的数据太少而无法计算用户之间的相关性。

  • 冷启动问题
    从技术上讲,每种方法都存在这个问题,但矩阵因子分解比协同过滤更好。冷启动问题基本上意味着您没有或几乎没有关于用户的任何数据。使用协作过滤器时无法解决此问题。期。
    您可以使用其他技术来克服此问题,即基于内容的过滤。

确定您应该使用哪种方法可能很困难。矩阵分解优于传统的基于用户和基于项目的协同过滤,但您必须确定它是否最适合您的模型。
如果您没有稀疏数据库,协作过滤器可以正常工作,但矩阵分解方法也是如此。

以下是一些有趣的网站,其中包含有关这些方法的数据。最后,由您或您的团队决定哪种方法效果最佳。

如果不够清楚,请随意询问更多内容!