假设我有以下数据集:
CustomerID ItemID Quantity
236 512 2
236 372 3
245 512 5
245 129 2
245 326 3
251 372 5
251 629 3
我想将此数据集表示为稀疏矩阵,其中行为CustomerIDs
,列为ItemIDs
,矩阵中的值表示Quantity
。因此,最终结果应如下所示:
(129) (326) (372) (512) (629)
(236) 0 0 3 2 0
(245) 2 3 0 5 0
(251) 0 0 5 0 3
我的最终矩阵的形状应为(3 x 5)
。如果客户和商品ID是大型随机数,我怎样才能实现这一目标?