关于二进制数据的Mahout建议

时间:2010-06-11 12:28:06

标签: recommendation-engine mahout

我是mahout的新手。我的目标是为二元用户购买的数据提供建议。所以我在计算电影镜头数据的前N个推荐中应用项目项相似性模型,假设1-3评级为0和4然后我尝试使用测试数据中的评分来评估我的建议,但是我的前20个建议中几乎没有两到三个匹配测试数据中的最高评级项目,并且大多数用户都没有匹配。

因此,我的建议本质上是完全不好的,还是我需要采取不同的措施来评估我的建议?

请帮帮我!提前谢谢。

Pranay, 第二年,UG学生。

1 个答案:

答案 0 :(得分:2)

我认为我们在邮件列表上回答了您的问题,这是一个更好的地方:

  

我会将所有值的所有评分都映射到1.实际上   这可能更“准确”。

     

您使用的是精确回忆测试吗?他们并不是非常糟糕   信息丰富,虽然他们是你唯一可以做的事情   评估没有评级的推荐。也就是说,它正在测试中   是否建议退回已知物品,但事实并非如此   必然是一个很好的测试,它是否提出了很好的建议。   它可以推荐更好的东西而不是获得信用。