评估基于用户的协同过滤K-最近邻算法

时间:2015-07-01 13:12:17

标签: recommendation-engine nearest-neighbor collaborative-filtering

我试图找到协作K-Nearest邻居算法的评估机制,但我很困惑如何评估这个算法。我怎样才能确定该算法所做的推荐是正确的还是好的。实际上我还开发了一种算法,我想与它进行比较。但我不确定如何比较和评估它们。我使用的数据集是电影镜头。

您的员工对评估此推荐系统的帮助将受到高度赞赏。

1 个答案:

答案 0 :(得分:0)

评估推荐系统是其研究和行业社区的一大关注点。请参阅Herlocker等人的论文“评估协同过滤推荐系统”。发布MovieLens数据的人(明尼苏达大学的GroupLens研究实验室)也发表了许多关于recsys主题的论文,PDF文章通常在http://grouplens.org/publications/免费。

查看https://scholar.google.com/scholar?hl=en&q=evaluating+recommender+systems

简而言之,您应该使用隐藏某些数据的方法。您将在一部分数据(称为“训练数据”)上训练您的模型,并测试您的模型以前从未见过的其余数据。有一种称为交叉验证的正式方法,但可见训练数据与隐藏测试数据的一般概念是最重要的。

我还推荐https://www.coursera.org/learn/recommender-systems,这是由GroupLens人员教授的关于推荐系统的Coursera课程。在该课程中,您将学习使用LensKit,这是一个包含大型评估套件的Java推荐系统框架。即使你不参加课程,LensKit也可能就是你想要的。