Question

如何在R中合并两个大型（大约500k列和行）稀疏矩阵的正式类dgCMatrix，这些稀疏矩阵具有不同的大小（列和行）？

简单示例：我有一个完整的6x6矩阵

1 2 3 4 5 6
1 0 0 0 0 0 0
2 0 0 0 0 0 0
3 0 0 0 0 0 0
4 0 0 0 0 0 0
5 0 0 0 0 0 0
6 0 0 0 0 0 0

现在我想合并不同大小的第二个矩阵：

结果应为：

1 2 3 4 5 6
1 0 0 0 1 0 0
2 0 0 0 0 0 0
3 0 0 0 0 1 0
4 1 0 0 0 0 0
5 0 0 0 0 0 0
6 0 0 0 0 0 0

我尝试cbindX并合并，但两者都不起作用：

只能使用矩阵和data.frames

或

不能将类“* structure（”dgCMatrix“，package =”Matrix“）强制转换为data.frame。

但是，我无法将此矩阵更改为此in this post建议的sparse=FALSE矩阵类或data.frame，因为在这种情况下，R无法再处理我机器上的矩阵大小。< / p>

任何帮助都将受到高度赞赏。谢谢！

Answer 1

一种策略是将矩阵转换回相同的大小，然后添加它们。

A <- sparseMatrix(8, 8, x = 1)
B <- sparseMatrix(c(1,3,5), c(3,6,3), x = c(1,4,1))

您可以使用summary(B)访问矩阵B的索引，然后只需使用sparseMatrix（i，j，x，dims）重新创建矩阵，就像在R中进行正常的子集化操作一样：

> summary(B)
5 x 6 sparse Matrix of class "dgCMatrix", with 3 entries 
  i j x
1 1 3 1
2 5 3 1
3 3 6 4

B <- sparseMatrix(i = summary(B)$i, j = summary(B)$j, x = summary(B)$x, dims = dim(A))

然后你可以添加矩阵：

A = A + B

在R中合并两个不同大小的dgCMatrix稀疏矩阵

1 个答案: