在R中创建所有数组索引的数据帧

时间:2011-10-06 08:45:20

标签: r matrix indices

使用R,我正在尝试构造给定矩阵的行和列号的数据帧。例如,如果

a   <- matrix(c(1:15), nrow=5, ncol=3)

然后我想构建一个给出的数据框:

row col
  1   1
  1   2
  1   3
  .   .
  5   1
  5   2
  5   3

我尝试了什么:

row <- matrix(row(a), ncol=1, nrow=dim(a)[1]*dim(a)[2], byrow=T)
col <- matrix(col(a), ncol=1, nrow=dim(a)[1]*dim(a)[2], byrow=T)
out <- cbind(row, col)
colnames(out) <- c("row", "col")

结果:

    row col
[1,]   1   1
[2,]   2   1
[3,]   3   1
[4,]   4   1
[5,]   5   1
[6,]   1   2
[7,]   2   2
[8,]   3   2
[9,]   4   2
[10,]  5   2
[11,]  1   3
[12,]  2   3
[13,]  3   3
[14,]  4   3
[15,]  5   3

这不是我正在寻找的,因为行和列的顺序突然颠倒,甚至强硬我指定“byrow = T”。我不知道我是否以及在哪里犯了错误但是非常感谢克服这个问题的建议。提前致谢!

4 个答案:

答案 0 :(得分:3)

使用rowcol,但更直接地操纵它们的输出顺序,因为它们为输入数组返回相应的索引到位。使用t获取您想要的非默认订单:

data.frame(row = as.vector(t(row(a))), col = as.vector(t(col(a))))
    row col
 1    1   1
 2    1   2
 3    1   3
 4    2   1
 5    2   2
 6    2   3
 7    3   1
 8    3   2
 9    3   3
 10   4   1
 11   4   2
 12   4   3
 13   5   1
 14   5   2
 15   5   3

或者,作为矩阵而不是data.frame:

cbind(as.vector(t(row(a))), as.vector(t(col(a))))
  [,1] [,2]
 [1,]    1    1
 [2,]    1    2
 [3,]    1    3
 [4,]    2    1
 [5,]    2    2
 [6,]    2    3
 [7,]    3    1
 [8,]    3    2
 [9,]    3    3
 [10,]   4    1
 [11,]   4    2
 [12,]   4    3
 [13,]   5    1
 [14,]   5    2
 [15,]   5    3

答案 1 :(得分:3)

我在向量1:ncol和1:nrow上使用expand.grid,然后用[,2:1]翻转列以按照你想要的顺序获取它们:

> expand.grid(seq(ncol(a)),seq(nrow(a)))[,2:1]
   Var2 Var1
1     1    1
2     1    2
3     1    3
4     2    1
5     2    2
6     2    3
7     3    1
8     3    2
9     3    3
10    4    1
11    4    2
12    4    3
13    5    1
14    5    2
15    5    3

答案 2 :(得分:1)

您可能需要查看?expand.grid,这正是您要实现的目标。

答案 3 :(得分:0)

由于有很多方法可以给猫皮肤,我会根据rep使用另一种变体:

data.frame(row=rep(seq(nrow(a)), each=ncol(a)), col=rep(seq(ncol(a)), nrow(a)))

...但是为了宣布一个“胜利者”,我认为你需要为解决方案计时:

# Make up a huge matrix...
a <- matrix(runif(1e7), 1e4)

system.time( a1<-data.frame(row = as.vector(t(row(a))),
                            col = as.vector(t(col(a)))) ) # 0.68 secs

system.time( a2<-expand.grid(col = seq(ncol(a)),
                             row = seq(nrow(a)))[,2:1] ) # 0.49 secs

system.time( a3<-data.frame(row=rep(seq(nrow(a)), each=ncol(a)),
                            col=rep(seq(ncol(a)), nrow(a))) ) # 0.59 secs

identical(a1, a2) && identical(a1, a3) # TRUE

...所以看来@Spacedman有最快的解决方案!