我有一个大的稀疏矩阵,并希望逐列对非零元素进行排名。我现在使用的方法是将所有零转换为NA
。这种方法的问题是,矩阵不再稀疏,并且具有空间复杂性。
有没有办法在不将{0}转换为rank
的情况下使用函数NA
?可重复的例子:
library(Matrix)
TestMatrix = Matrix(c(0,100,12,0,11,
0,100,12,0,11,
0,100,12,0,11,
0,100,12,0,11,
0,100,12,0,11), 5, sparse = TRUE)
TestMatrix = replace(TestMatrix, TestMatrix == 0, NA)
apply(-TestMatrix, 2, function(x) {rank(x, na.last = TRUE)})
我想要一个相同大小的稀疏矩阵,非零值替换为逐列排名。
答案 0 :(得分:1)
您的示例TestMatrix
:
#5 x 5 sparse Matrix of class "dgCMatrix"
#
#[1,] . . . . .
#[2,] 100 100 100 100 100
#[3,] 12 12 12 12 12
#[4,] . . . . .
#[5,] 11 11 11 11 11
我想要一个相同大小的稀疏矩阵,非零值替换为逐列排名。
n <- diff(TestMatrix@p) ## number of non-zeros per column
lst <- split(TestMatrix@x, rep.int(1:ncol(TestMatrix), n)) ## columns to list
r <- unlist(lapply(lst, rank)) ## column-wise ranking and result collapsing
RankMatrix <- TestMatrix ## copy sparse matrix
RankMatrix@x <- r ## replace non-zero elements with rank
#5 x 5 sparse Matrix of class "dgCMatrix"
#
#[1,] . . . . .
#[2,] 3 3 3 3 3
#[3,] 2 2 2 2 2
#[4,] . . . . .
#[5,] 1 1 1 1 1