如何在R中合并两个大型(大约500k列和行)稀疏矩阵的正式类dgCMatrix
,这些稀疏矩阵具有不同的大小(列和行)?
简单示例:我有一个完整的6x6矩阵
1 2 3 4 5 6
1 0 0 0 0 0 0
2 0 0 0 0 0 0
3 0 0 0 0 0 0
4 0 0 0 0 0 0
5 0 0 0 0 0 0
6 0 0 0 0 0 0
现在我想合并不同大小的第二个矩阵:
3 4 5 6
1 0 1 0 0
3 0 0 1 0
4 1 0 0 0
结果应为:
1 2 3 4 5 6
1 0 0 0 1 0 0
2 0 0 0 0 0 0
3 0 0 0 0 1 0
4 1 0 0 0 0 0
5 0 0 0 0 0 0
6 0 0 0 0 0 0
我尝试cbindX
并合并,但两者都不起作用:
只能使用矩阵和data.frames
或
不能将类“* structure(”dgCMatrix“,package =”Matrix“)强制转换为data.frame。
但是,我无法将此矩阵更改为此in this post建议的sparse=FALSE
矩阵类或data.frame,因为在这种情况下,R无法再处理我机器上的矩阵大小。< / p>
任何帮助都将受到高度赞赏。谢谢!
答案 0 :(得分:5)
一种策略是将矩阵转换回相同的大小,然后添加它们。
A <- sparseMatrix(8, 8, x = 1)
B <- sparseMatrix(c(1,3,5), c(3,6,3), x = c(1,4,1))
您可以使用summary(B)
访问矩阵B的索引,然后只需使用sparseMatrix(i,j,x,dims)重新创建矩阵,就像在R中进行正常的子集化操作一样:
> summary(B)
5 x 6 sparse Matrix of class "dgCMatrix", with 3 entries
i j x
1 1 3 1
2 5 3 1
3 3 6 4
B <- sparseMatrix(i = summary(B)$i, j = summary(B)$j, x = summary(B)$x, dims = dim(A))
然后你可以添加矩阵:
A = A + B