基于用户的推荐系统无法正常工作(mahout)

时间:2015-03-30 05:49:11

标签: java mahout recommendation-engine mahout-recommender

我已经实现了一个基于用户的基本推荐系统,但是当我运行该程序时,有很多用户(在输出中)没有任何推荐项目。

我认为这可能是由于我的datamodel,如果该用户有单个项目,但该用户有多个项目。

我在做什么错误?

我的代码是这样的 -

DataModel dm =new FileDataModel(new File("data.csv"));

UserSimilarity similarity =new PearsonCorrelationSimilarity(dm);

UserNeighborhood neighborhood = new ThresholdUserNeighborhood(0.1, similarity, dm);

UserBasedRecommender recommander= new GenericUserBasedRecommender(dm,neighborhood,similarity);

for(LongPrimitiveIterator users=dm.getUserIDs(); users.hasNext();)
{
   Long UserID=users.nextLong();
   List<RecommendedItem>recommendations = recommander.recommend(UserID,10000);
   for(RecommendedItem recommendation : recommendations)
   {

    System.out.println(recommendation);
   }

}

我的datamodel格式是 - (userID,ItemID,preference)

像 -

25417,11114,1
25417,11114,1
25669,11114,1
25333,11114,1
26426,11114,1
26427,11114,1
25432,11114,1
26432,11114,1
26432,11114,1
13720603,116608,1
13720602,204167,1
13720602,198158,1
13720604,6584,1
13720605,3124,1
217778,76263,2
13720606,5199,1
13720607,63613,1
217778,49443,1
13720608,118189,1
13361003,65759,2
13361003,65759,2
13673094,19002,1
13720609,3284,2
13720610,167130,1
13720611,211780,1
13720611,211780,1
13720612,62397,1
13720613,62397,1
13720614,60860,1
13720613,62397,1
13720615,108533,1 

请帮忙。我无法找出问题。

1 个答案:

答案 0 :(得分:1)

用户和项ID必须转换为非负的int,以便它们对应于数据集的行号和列号。这意味着您需要创建字典以将特定于应用程序的ID转换为Mahout ID。

顺便说一下,Mahout有一个更新的更好的推荐架构(它将使用您的应用程序特定ID):

  1. Mahout Intro to Cooccurrence Recommenders
  2. 一本免费的电子书,讲述了一般的想法:Practical Machine Learning
  3. 幻灯片,介绍混合动作或其他指标:Creating a Multimodal Cooccurrence Recommender
  4. 两篇博客文章:推荐人的新功能:part #1以及推荐人的新功能:part #2
  5. 描述对数似然比的帖子:Surprise and Coinsidense LLR用于降低数据中的噪声,同时保持计算O(n)的复杂性。