我有一个用户,即项目交互数据,形式为三元组(用户,项目,值)。例如(A74, 1172952, 1)
。
UserID ItemID Ratings
A74 1172952 1
176 1178735 1
70C 341785 4
67E 136771 3
383 1178883 2
我正在尝试从表中获取项目或用户向量。项目向量的示例可以是
{1172952:[1,4,5..........2,1],
1178735:[1,3,5..........5,3],
1178883:[2,4,3..........2,3],....}
pandas.pivot_table
可以处理较小的数据集,但是对于较大的数据集(例如10,000个用户和10,000个项目),它会惨遭失败。在python中有更快,更整洁的方法吗?