在R中合并两个不同大小的dgCMatrix稀疏矩阵

时间:2015-08-05 08:41:46

标签: r matrix merge sparse-matrix

如何在R中合并两个大型(大约500k列和行)稀疏矩阵的正式类dgCMatrix,这些稀疏矩阵具有不同的大小(列和行)?

简单示例:我有一个完整的6x6矩阵

1 2 3 4 5 6
1 0 0 0 0 0 0
2 0 0 0 0 0 0
3 0 0 0 0 0 0
4 0 0 0 0 0 0
5 0 0 0 0 0 0
6 0 0 0 0 0 0

现在我想合并不同大小的第二个矩阵:

3 4 5 6
1 0 1 0 0 
3 0 0 1 0 
4 1 0 0 0 

结果应为:

1 2 3 4 5 6
1 0 0 0 1 0 0
2 0 0 0 0 0 0
3 0 0 0 0 1 0
4 1 0 0 0 0 0
5 0 0 0 0 0 0
6 0 0 0 0 0 0

我尝试cbindX并合并,但两者都不起作用:

  

只能使用矩阵和data.frames

  

不能将类“* structure(”dgCMatrix“,package =”Matrix“)强制转换为data.frame。

但是,我无法将此矩阵更改为此in this post建议的sparse=FALSE矩阵类或data.frame,因为在这种情况下,R无法再处理我机器上的矩阵大小。< / p>

任何帮助都将受到高度赞赏。谢谢!

1 个答案:

答案 0 :(得分:5)

一种策略是将矩阵转换回相同的大小,然后添加它们。

A <- sparseMatrix(8, 8, x = 1)
B <- sparseMatrix(c(1,3,5), c(3,6,3), x = c(1,4,1))

您可以使用summary(B)访问矩阵B的索引,然后只需使用sparseMatrix(i,j,x,dims)重新创建矩阵,就像在R中进行正常的子集化操作一样:

> summary(B)
5 x 6 sparse Matrix of class "dgCMatrix", with 3 entries 
  i j x
1 1 3 1
2 5 3 1
3 3 6 4

B <- sparseMatrix(i = summary(B)$i, j = summary(B)$j, x = summary(B)$x, dims = dim(A))

然后你可以添加矩阵:

A = A + B