推荐系统 - 使用不同的指标

时间:2012-06-06 18:43:19

标签: python metrics recommendation-engine personalization cosine-similarity

我正在寻求实施基于项目的新闻推荐系统。我想通过几种方式跟踪用户对新闻项目的兴趣;它们包括:评分(1-5),收藏,点击以及在新闻项目上花费的时间。

我的问题:为推荐系统使用这些不同的指标有哪些好的方法?也许以某种方式合并和规范它们?

2 个答案:

答案 0 :(得分:0)

研究领域的推荐系统通常以1-5的比例工作。从用户那里获得这样一个明确的信号是相当不错的。但是我想现实情况是,你系统的大多数用户实际上都不会给出评分,在这种情况下你没有任何工作要做。

因此我会跟踪页面浏览量,但也会尝试使用一些明确的反馈机制(1-5,竖起大拇指或下移等)。

您的算法必须考虑到这一点。

答案 1 :(得分:0)

对于推荐系统,有两个问题:

  1. 如何根据您收集的数字量化用户对某个项目的兴趣

  2. 如何使用量化的兴趣数据向用户推荐新项目

  3. 我猜你对第一个问题更感兴趣。

    要解决第一个问题,您需要线性组合或其他一些奇特的功能来组合所有数字。所有系统都没有单一的通用功能。这在很大程度上取决于您的用户和您的项目类型。如果您需要高质量的推荐系统,您需要有一些数据来进行机器学习以培训您的功能。

    对于第二个问题,它在某种程度上是相同的,加上你需要分析所有项目以抽象彼此之间的某些关系。你可以谷歌“Netflix奖”获取一些有趣的信息。