我有一组用户项对,根据最近的6M条记录保留一个块,并每分钟更新一次。我不喜欢这些重建之间的一些重要数据可能未使用。例如,新用户已加入系统,但模型尚不了解他。我找到了 PlusAnonymousConcurrentUserDataModel 类,该类允许向模型添加少量条目并获得更准确的推荐。文档为此提出了更多受限的使用方案:我必须:
在通过计时器实际重建模型之前,可以使用此类迭代收集数据吗?什么是正确的方法?似乎 PlusAnonymousConcurrentUserDataModel 出于不同的目的。
答案 0 :(得分:0)
Mahout的这一部分非常古老,已被弃用。我认为它甚至不在0.14.0版本中,您必须从源代码进行构建。
Mahout现在使用一种全新的技术进行推荐。新算法称为Correlated Cross-Ocurrence(CCO)。您所使用的旧方法没有像概述的那样利用实时输入。只要有某种形式的行为数据,CCO可以向尚未内置在模型中的匿名用户推荐。
实现CCO的体系结构需要数据库中的数据存储和KNN引擎(搜索引擎)来进行模型查询。这些都打包在Apache PredictionIO + Universal Recommender模板中。
可以在https://groups.google.com/forum/#!forum/actionml-user或其他项目的邮件列表中找到对通用推荐器本身的社区支持。