对于像为用户推荐项目这样的任务,我可以将数据集拆分为两个:训练和测试数据集,我可以使用平均绝对误差来评估结果。但是,当我需要查找项目的类似项目时,我不知道如何评估结果。例如,
输入:
userid,itemid,score 1, 123, 5 2, 222, 1 ....
svd.similar(123)
输出可能是:(222,0.98),(121,0.78)...... 我不知道从svd找到的类似物品是好还是不好,如何评估结果?
答案 0 :(得分:2)
您可能希望首先定义相似度函数(距离函数),例如余弦距离/欧几里德距离。然后可以确定和比较相似性。