什么距离措施在基于内容的推荐系统上表现良好?

时间:2015-03-24 19:08:25

标签: hadoop vector recommendation-engine tf-idf euclidean-distance

我想实现基于内容的推荐系统,该系统根据用户输入提供推荐书籍列表。

我将使用TF-IDF来确定单词对给定书籍的重要程度,并为每本书创建书籍特征向量。

我需要创建一个相似度矩阵来确定可能的书籍对。为了做到这一点,我遇到了欧几里德距离。还有比欧几里得更好的其他方法吗?

1 个答案:

答案 0 :(得分:1)

这些是您可能尝试的一些良好的距离测量:

  • (概括)Jaccard距离
  • 曼哈顿距离
  • Hellinger距离
  • 余弦相似度