我正在尝试使用predict.io构建一个混合推荐器,它可以作为引擎盖下spark / mllib顶层的一层。
我正在寻找一种在执行推荐请求时在ALS算法中加入基于标签的提升的方法。
使用内容信息来改进协作过滤似乎是一种通常的路径,尽管我找不到任何关于将协作算法(例如ALS)与基于内容的度量相结合的文档。
任何关于将内容相似性与mllib(spark)或mahout(hadoop)的协同过滤相结合的示例或文档将不胜感激。
答案 0 :(得分:2)
此PredictionIO模板使用Mahout的Spark版本的Correlator,因此它可以利用多种操作向用户推荐或查找类似的项目。它允许您包含多个分类标记内容以增强或过滤rec。
http://templates.prediction.io/PredictionIO/template-scala-parallel-universal-recommendation
v0.2.0分支还具有日期范围过滤功能,热门项目回填正在开发中。