我正在考虑在hadoop中实现基于内容的推荐项目构想。
如果weka可以与hadoop一起使用,或者建议使用Mahout进行基于cbf的实现,那么只需要建议
请告知
谢谢
答案 0 :(得分:0)
你的内容是什么?什么数据包围或组成您的项目?
有几种方法可以将此用于recs,如果合适,有些方法可以混合使用协同过滤数据。看看Mahout中的行相似度。它计算项目与所有其他项目的相似性。如果您以某种方式输入内容,则可以消化您的CBR。
例如,推荐类似博客帖子的输入将是: postID,来自文章的令牌
然后,对于每个postID,您将获得一个列表,其他使用相似单词的postID。您也可以对标签,类别或其他元数据执行相同的操作。