如何将data.frame转换为R中的多维数组?

时间:2012-04-05 22:22:04

标签: r dataframe plyr

我正在寻找一种更通用的方法从data.frame到多维数组。

我希望能够根据需要从数据框中的尽可能多的变量创建所需数量的维度。

目前,该方法必须针对每个data.frame进行定制,需要转租以形成矢量。

我喜欢plyr的融化/演员方法。

   data<-data.frame(coord.name=rep(1:10, 2),
             x=rnorm(20),
             y=rnorm(20),
             ID=rep(c("A","B"), each=10))


    data.array<-array(dim=c(10, 2, length(unique(data$ID))))

    for(i in 1:length(unique(data$ID))){
      data.array[,1,i]<-data[data$ID==unique(data$ID)[i],"x"]
      data.array[,2,i]<-data[data$ID==unique(data$ID)[i],"y"]
    }

data.array
, , 1

      [,1] [,2]
 [1,]    1    1
 [2,]    3    3
 [3,]    5    5
 [4,]    7    7
 [5,]    9    9
 [6,]    1    1
 [7,]    3    3
 [8,]    5    5
 [9,]    7    7
[10,]    9    9

, , 2

      [,1] [,2]
 [1,]    2    2
 [2,]    4    4
 [3,]    6    6
 [4,]    8    8
 [5,]   10   10
 [6,]    2    2
 [7,]    4    4
 [8,]    6    6
 [9,]    8    8
[10,]   10   10

2 个答案:

答案 0 :(得分:7)

您可能在应用 reshape2 功能时出于某种微妙的原因而遇到了问题。困难在于您的data.frame没有可用于指导您希望如何沿输出数组的第一维排列元素的列。

下面,我明确添加了这样一个列,称之为"row"。有了它,您可以使用富有表现力的acast()dcast()函数以您选择的任何方式重塑数据。

library(reshape2)

# Use this or some other method to add a column of row indices.
data$row <- with(data, ave(ID==ID, ID, FUN = cumsum))

m <- melt(data, id.vars = c("row", "ID"))
a <- acast(m, row ~ variable ~ ID)

a[1:3, , ]
# , , A
# 
#   x y
# 1 1 1
# 2 3 3
# 3 5 5
#
# , , B
# 
#   x y
# 1 2 2
# 2 4 4
# 3 6 6

答案 1 :(得分:4)

我认为这是对的:

array(unlist(lapply(split(data, data$ID), function(x) as.matrix(x[ , c("x", "y")]))), c(10, 2, 2))