我正致力于创建基于项目的协作推荐引擎。可用的数据集大小为:
用户数量:约(3,00,000)
项目数:525
R中的推荐器包需要用户项目评级矩阵。我有一个包含列的熔化数据表: User_Code,Item_Code,Ratings
从这个数据集中我必须使用R中的“acast”函数创建用户项目评级矩阵。但是考虑到数据的大小,我得到了错误:
错误:无法分配250GB的矢量。
此步骤是否有解决方法或增加RAM是唯一的选择?
答案 0 :(得分:0)
尝试执行以下操作: 1.仅选择具有实际项目评级的用户(推荐一些项目/对其进行排名)。因此,您只能使用真实有价值的数据。 2.如果步骤1中的数据集仍然太大,只需选择具有适当评级的随机N(10000,20000)用户