在稀疏矩阵中逐列对非零元素进行排名

时间:2017-01-20 21:53:08

标签: r matrix sparse-matrix

我有一个大的稀疏矩阵,并希望逐列对非零元素进行排名。我现在使用的方法是将所有零转换为NA。这种方法的问题是,矩阵不再稀疏,并且具有空间复杂性。

有没有办法在不将{0}转换为rank的情况下使用函数NA?可重复的例子:

library(Matrix)

TestMatrix = Matrix(c(0,100,12,0,11,
                      0,100,12,0,11,
                      0,100,12,0,11,
                      0,100,12,0,11,
                      0,100,12,0,11), 5, sparse = TRUE)

TestMatrix = replace(TestMatrix, TestMatrix == 0, NA)

apply(-TestMatrix, 2, function(x) {rank(x, na.last = TRUE)})

我想要一个相同大小的稀疏矩阵,非零值替换为逐列排名。

1 个答案:

答案 0 :(得分:1)

您的示例TestMatrix

#5 x 5 sparse Matrix of class "dgCMatrix"
#                        
#[1,]   .   .   .   .   .
#[2,] 100 100 100 100 100
#[3,]  12  12  12  12  12
#[4,]   .   .   .   .   .
#[5,]  11  11  11  11  11
  

我想要一个相同大小的稀疏矩阵,非零值替换为逐列排名。

n <- diff(TestMatrix@p)  ## number of non-zeros per column
lst <- split(TestMatrix@x, rep.int(1:ncol(TestMatrix), n))  ## columns to list
r <- unlist(lapply(lst, rank))  ## column-wise ranking and result collapsing
RankMatrix <- TestMatrix  ## copy sparse matrix
RankMatrix@x <- r  ## replace non-zero elements with rank

#5 x 5 sparse Matrix of class "dgCMatrix"
#              
#[1,] . . . . .
#[2,] 3 3 3 3 3
#[3,] 2 2 2 2 2
#[4,] . . . . .
#[5,] 1 1 1 1 1