两次嵌套在列表中的矩阵组合和操作

时间:2012-12-20 17:19:50

标签: r data-structures nested-lists

如果xmpl是一个列表,其中每个元素都有一个整数age和一个列表data,其中data包含三个大小相等的矩阵ac

最好的方法是什么

cor( xmpl[[:]]$data[[:]][c('a','b','c')],  xmpl[[:]]$age)

其中结果为3 x length(a)数组或列表,其反映agea(第1行)的每个元素的每个实例相关联,b(第2行)和c上的xmpl(第3行)。


我正在阅读代表不同管道输出的矩阵。每个科目有3个这样的科目和很多科目。目前,我已经建立了一系列主题,其中包括管道矩阵列表。

结构如下:

 str(exmpl)
 $ :List of 4
  ..$ id       : int 5
  ..$ age      : num 10
  ..$ data     :List of 3
  .. ..$ a: num [1:10, 1:10] 0.782 1.113 3.988 0.253 4.118 ...
  .. ..$ b: num [1:10, 1:10] 5.25 5.31 5.28 5.43 5.13 ...
  .. ..$ c: num [1:10, 1:10] 1.19e-05 5.64e-03 7.65e-01 1.65e-03 4.50e-01 ...
  ..$ otherdata: chr "ignorefornow"
  #[...]

我希望将所有科目中a的每个元素与受试者的年龄相关联。然后对bc执行相同的操作,并将结果放入列表中。

我认为我正以一种对R来说很尴尬的方式接近这一点。我对存储和检索这些数据的“R方式”感兴趣。

Data Structure and desired output http://dl.dropbox.com/u/56019781/linked/struct-2012-12-19.svg

library(plyr)

## example structure
xmpl.mat  <- function(){ matrix(runif(100),nrow=10) }
xmpl.list <- function(x){ list(  id=x, age=2*x, data=list(  a=x*xmpl.mat(), b=x+xmpl.mat(), c=xmpl.mat()^x   ), otherdata='ignorefornow' ) }
xmpl      <- lapply( 1:5, xmpl.list )

## extract
ages <- laply(xmpl,'[[','age')
data <- llply(xmpl,'[[','data')

# to get the cor for one set of matrices is easy enough
# though it would be nice to do: a <- xmpl[[:]]$data$a
x.a      <- sapply(data,'[[','a')
x.a.corr <- apply(x.a,1,cor,ages)

# ...

#xmpl.corr   <- list(x.a.corr,x.b.corr,x.c.corr)

# and by loop, not R like?
xmpl.corr<-list()
for (i in 1:length(names(data[[1]])) ){
  x <- sapply(data,'[[',i)
  xmpl.corr[[i]] <- apply(x,1,cor,ages)
}
names(xmpl.corr) <- names(data[[1]])

最终输出:

str(xmpl.corr)
List of 3
 $ a: num [1:100] 0.712 -0.296 0.739 0.8 0.77 ...
 $ b: num [1:100] 0.98 0.997 0.974 0.983 0.992 ...
 $ c: num [1:100] -0.914 -0.399 -0.844 -0.339 -0.571 ..

2 个答案:

答案 0 :(得分:3)

这是一个解决方案。它应该足够短。

ages <- sapply(xmpl, "[[", "age")                      # extract ages
data <- sapply(xmpl, function(x) unlist(x[["data"]]))  # combine all matrices
corr <- apply(data, 1, cor, ages)                      # calculate correlations
xmpl.corr <- split(corr, substr(names(corr), 1, 1))    # split the vector

答案 1 :(得分:1)

您可能希望在一个列表中包含所有这些内容,而不是x.a,x.b,x.c.

# First, get a list of the items in data
      abc  <- names(xmpl[[1]]$data)    # incase variables change in future
names(abc) <- abc   # these are the same names that will be used for the final list. You can use whichever names make sense


## use lapply to keep as list, use sapply to "simplify" the list
x.data.list <- lapply(abc, function(z)
                  sapply(xmpl, function(xm) c(xm$data[[z]])) )

ages <- sapply(xmpl, `[[`, "age")

# Then compute the correlations.  Note that on each element of x.data.list we are apply'ing per row
correlations <- lapply(x.data.list, apply, 1, cor, ages)