我正在根据用户的点击行为开发个性化的新闻推荐引擎。我的功能将是预定义的新闻类别 (例如政治,体育等)。
每当用户点击文章时,我会根据本文构建/更新用户个人资料,然后推荐文章池中的另一篇文章。
关于这个系统的评估,我需要一个包含二进制用户项交互的数据集(用户点击推荐文章与否) - 我找不到适合这个特定环境的数据集。我要做的是,二进制Movielens数据集,然后计算精度和召回。
我在MovieLens数据集中的实际操作如下:如果用户对某个项目的评级大于该用户的平均评级,我会为其指定二进制评级为1,否则为<。 /强>
这种方法是评估此类系统的正确方法吗?
答案 0 :(得分:2)