为基于项目的协作过滤器创建用户项目评级矩阵时出错

时间:2017-01-27 11:45:53

标签: r recommendation-engine collaborative-filtering

我正致力于创建基于项目的协作推荐引擎。可用的数据集大小为:

用户数量:约(3,00,000)

项目数:525

R中的推荐器包需要用户项目评级矩阵。我有一个包含列的熔化数据表: User_Code,Item_Code,Ratings

从这个数据集中我必须使用R中的“acast”函数创建用户项目评级矩阵。但是考虑到数据的大小,我得到了错误:

错误:无法分配250GB的矢量。

此步骤是否有解决方法或增加RAM是唯一的选择?

1 个答案:

答案 0 :(得分:0)

尝试执行以下操作: 1.仅选择具有实际项目评级的用户(推荐一些项目/对其进行排名)。因此,您只能使用真实有价值的数据。 2.如果步骤1中的数据集仍然太大,只需选择具有适当评级的随机N(10000,20000)用户