如何在巨大的数据集上实现基于项目的协同过滤?

时间:2016-12-27 04:25:28

标签: recommendation-engine

假设我有一个500k x 500k的用户项购买历史二进制矩阵。我计划计算用户项目相似度(通过条件概率)并将其存储到项目 - 项目矩阵中。但是在如此庞大的数据集中,是否有任何推荐的方法来计算和存储数据?

请查看MongoDB以存储所有预计算结果,但仍不确定哪个效果最好?任何帮助或想法将不胜感激。

0 个答案:

没有答案