我已经实现了一个基于用户的基本推荐系统,但是当我运行该程序时,有很多用户(在输出中)没有任何推荐项目。
我认为这可能是由于我的datamodel,如果该用户有单个项目,但该用户有多个项目。
我在做什么错误?
我的代码是这样的 -
DataModel dm =new FileDataModel(new File("data.csv"));
UserSimilarity similarity =new PearsonCorrelationSimilarity(dm);
UserNeighborhood neighborhood = new ThresholdUserNeighborhood(0.1, similarity, dm);
UserBasedRecommender recommander= new GenericUserBasedRecommender(dm,neighborhood,similarity);
for(LongPrimitiveIterator users=dm.getUserIDs(); users.hasNext();)
{
Long UserID=users.nextLong();
List<RecommendedItem>recommendations = recommander.recommend(UserID,10000);
for(RecommendedItem recommendation : recommendations)
{
System.out.println(recommendation);
}
}
我的datamodel格式是 - (userID,ItemID,preference)
像 -
25417,11114,1
25417,11114,1
25669,11114,1
25333,11114,1
26426,11114,1
26427,11114,1
25432,11114,1
26432,11114,1
26432,11114,1
13720603,116608,1
13720602,204167,1
13720602,198158,1
13720604,6584,1
13720605,3124,1
217778,76263,2
13720606,5199,1
13720607,63613,1
217778,49443,1
13720608,118189,1
13361003,65759,2
13361003,65759,2
13673094,19002,1
13720609,3284,2
13720610,167130,1
13720611,211780,1
13720611,211780,1
13720612,62397,1
13720613,62397,1
13720614,60860,1
13720613,62397,1
13720615,108533,1
请帮忙。我无法找出问题。
答案 0 :(得分:1)
用户和项ID必须转换为非负的int,以便它们对应于数据集的行号和列号。这意味着您需要创建字典以将特定于应用程序的ID转换为Mahout ID。
顺便说一下,Mahout有一个更新的更好的推荐架构(它将使用您的应用程序特定ID):