我已经构建了一个推荐系统,根据一组加权指标推荐与项目类似的前10个项目。现在所有人都可以选择一个项目,系统显示与所选项目类似的前10个项目。我对可用于评估此类系统的评估技术感到困惑。在没有用户参与的情况下,精确/召回估计是否有意义?任何有关此类系统评估技术的指南都将不胜感激。
答案 0 :(得分:0)
为了评估精确度和召回率,您需要以某种方式获得某些输入的正确答案。在这种情况下,正确的答案可能意味着最相似的项目,或10个类似项目的确切有序列表。然后,您可以将算法的输出与正确的答案进行比较。根据这些信息,您还需要一种学习方法,即调整算法以接近正确的答案。当您使用真实用户运行系统时,也可以使用算法的此更新部分:如果您向真实用户显示10个相关项目,并且用户选择其中一个,那么您应该更新权重,以便选择的建议用户下次有更高的排名。如果您对用户进行分析并对其进行分组,这可能会更深入,因此来自不同类别的用户必须查看与给定项目相关的不同相关项目。