应用错误收集

PredictionIO数据导入

时间：2014-08-20 11:14:01

标签： prediction recommendation-engine mahout-recommender predictionio

我考虑使用PredictionIO来构建音乐推荐系统。

但是，在用户项交互中，仅支持以下操作：例如，不喜欢，查看，转换和费率（比例1 - 5）。

我现有的数据仅包含视图（用户收听歌曲）。

我应该如何将数据翻译为PredictionIO输入？我可以为同一个用户项创建多个视图记录（更多视图=更多权重），还是PredictionIO根据时间戳查看最新的视图记录？

2 个答案:

答案 0 :(得分：0)

我只使用Mahout，因此不知道PredictionIO如何将您的数据转换为输入和算法选择。

对于Mahout，您可以使用基于项目的推荐器使用布尔输入并输入您的＆＃34; listen＆＃34;作为值为1的动作和相似性度量SIMILARITY_LOGLIKELIHOOD。 LLR无论如何都会忽略权重。权重用于尝试预测用户评级的旧式推荐器。这些天大多数人对排名更感兴趣，上面的配置会给你最好的结果。

答案 1 :(得分：0)

仅仅为了完整性，正如PredictionIO user group：

中所回答的那样

截至当前版本0.7，内置算法不会聚合多个查看动作，因此更多的视图动作并不意味着更多的重量。你可以自定义算法来处理它。

如果您有多个U2I操作（例如，查看，比如评分），您可以定义冲突解决标准（例如，最新，最高）。但在你的情况下，只有一个动作（即用户听歌），多个“视图”将相当于一个“视图”。

下一版本的PredictionIO将更好地支持自定义算法和引擎（例如音乐推荐）。