我正在使用MyMediaLite的项目推荐工具,我试图了解如何生成仅包含测试集项目的预测文件。 实际上,使用默认选项(--overlap-items),它会生成一个预测文件,其中包含测试集中存在的项目和不存在的项目。这真的很烦人,因为我需要获得正确的推荐,以便为我的推荐者生成指标(我使用外部工具来生成指标)。 所以我已经尝试了选项" - in-test-items"应该只使用测试集中的那些作为候选项目,但这不是我获得的结果。实际上,我正在使用我根据特定策略进行二值化的movielens 100k数据集:我已将1分配给评级为4或5的项目,否则为0。
我想在这里报告我使用的命令,以便在隐式反馈情况下产生推荐(假设我尝试在数据集的第一次拆分时执行测试):
item_recommendation --training-file = u1.base --test-file = u1.test --prediction-file = u1.mml_res --in-test-items --recommender = ItemKNN --predict-items-number = 10
此命令中有不正确的内容?我需要修理一下吗?
提前谢谢。
Alessandro Suglia
答案 0 :(得分:1)
在这封电子邮件主题中回答了这个问题:https://groups.google.com/forum/#!topic/mymedialite/Sm6RXehqrYE