R中的排名和计数矩阵元素

时间:2016-07-29 17:17:02

标签: r sorting matrix rank

我知道有类似的问题,但我无法找到问题的答案。我试图在矩阵中对元素进行排名,然后提取5个最高元素的数据。

这是我的尝试。

set.seed(20)
d<-matrix(rnorm(100),nrow=10,ncol=10)
start<-d[1,1]
for (i in 1:10) {
for (j in 1:10) {
  if (start < d[i,j])
  {high<-d[i,j]
  rowind<-i
  colind<-j
  }
  }
}

虽然这给了我最高元素的数据,包括行号和列号,但是我不能想办法对从2到5排列的元素做同样的事情。我也试过了

  rank(d, ties.method="max")

但它没有用,因为它只是以矢量格式吐出排名。 我最终想要的是包含的数据框(或任何类型的表) 排名,列名,行名和矩阵中最高5个元素的数据(数字)。

修改

set.seed(20)
d<-matrix(rnorm(100),nrow=10,ncol=10)
d[1,2]<-5
d[2,1]<-5 
d[1,3]<-4
d[3,1]<-4

感谢您的回答。那些完全符合我的目的,但是当我为相关图运行这个代码时 - 每一对都会有重复的数字 - 我想只计算两个数字中的一个用于排名目的。有没有办法做到这一点?感谢。

3 个答案:

答案 0 :(得分:4)

这是一种非常粗暴的方式:

DF = data.frame(row = c(row(d)), col = c(col(d)), v = c(d))
DF[order(DF$v, decreasing=TRUE), ][1:5, ]

   row col        v
91   1  10 2.208443
82   2   9 1.921899
3    3   1 1.785465
32   2   4 1.590146
33   3   4 1.556143

最好只需要进行部分排序,但在?order中,看起来此选项仅适用于sort,而不适用于order

如果矩阵具有行和列名称,则可以方便地查看它们而不是数字。这就是我可能会做的事情:

dimnames(d) <- list(letters[1:10], letters[1:10])
DF = data.frame(as.table(d))

DF[order(DF$Freq, decreasing=TRUE), ][1:5, ]

   Var1 Var2     Freq
91    a    j 2.208443
82    b    i 1.921899
3     c    a 1.785465
32    b    d 1.590146
33    c    d 1.556143

不幸的是,列名在这里没有多大意义,但你可以像往常一样用names(DF) <-更改它们。

答案 1 :(得分:2)

以下是Matrix

的一个选项
library(Matrix)
m1 <- summary(Matrix(d, sparse=TRUE))
head(m1[order(-m1[,3]),],5)
#   i  j        x
#93 3 10 2.359634
#31 1  4 2.234804
#23 3  3 1.980956
#55 5  6 1.801341
#16 6  2 1.678989

或使用melt

library(reshape2)
m2 <- melt(d)
head(m2[order(-m2[,3]), ], 5)

答案 2 :(得分:1)

基础R中有一些非常简单的东西。

# set.seed(20)
# d <- matrix(rnorm(100), nrow = 10, ncol = 10)

d.rank <- matrix(rank(-d), nrow = 10, ncol = 10)

which(d.rank <= 5, arr.ind=TRUE)
     row col
[1,]   3   1
[2,]   2   4
[3,]   3   4
[4,]   2   9
[5,]   1  10

d[d.rank <= 5]
[1] 1.785465 1.590146 1.556143 1.921899 2.208443

结果可以(轻松)变得清晰(见弗兰克的评论):

cbind(which(d.rank <= 5, arr.ind=TRUE), v = d[d.rank <= 5], rank = rank(-d[d.rank <= 5]))

     row col        v rank
[1,]   3   1 1.785465    3
[2,]   2   4 1.590146    4
[3,]   3   4 1.556143    5
[4,]   2   9 1.921899    2
[5,]   1  10 2.208443    1