是否有可能在基于内容的推荐中

时间:2015-07-23 10:51:12

标签: algorithm mahout recommendation-engine cosine-similarity

我正在探索基于内容的算法,所以我了解到基于内容的算法可以用来计算项目和用户之间的相似性,就像“pandora”正在进行中一样。所以我的要求是我有百分之一,例如用户可以喜欢40%蔬菜和60%非蔬菜,有喜欢/不喜欢的比例。这个项目也有属性蔬菜,非蔬菜。我可以计算用户偏好比率和项目的相似度,还是有任何算法符合我的要求或帮助我的文档?

提前致谢

1 个答案:

答案 0 :(得分:0)

许多标准相似度算法,包括余弦相似度(https://en.wikipedia.org/wiki/Cosine_similarity)都是合适的。如果您有两个向量(即,按某种顺序为一个用户的所有属性得分,然后以相同顺序为另一个用户的所有属性得分),则可以使用这些向量的余弦相似度。如果您有用户A和B以及属性" veg","辣"和" sweet",并且每个属性的用户都有分数,只需插入它们进入余弦相似度算法。由于veg和non-veg只增加到100%,因此不需要计算两者,因为与veg相比,非veg不会添加任何信息。