有关llply或lapply的问题 - 将函数应用于列表中的data.frames

时间:2011-09-25 14:15:51

标签: list r plyr zoo lapply

亲爱的R用户社区,

我在列表中有很多data.frames,如下所示(为方便起见,只显示了21个列表中的一个data.frame):

> str(datal)
List of 21
 $ BallitoRaw.DAT                :'data.frame': 1083 obs. of  3 variables:
  ..$ Filename: Factor w/ 21 levels "BallitoRaw.DAT",..: 1 1 1 1 1 1 1 1 1 1 ...
  ..$ date    :Class 'Date'  num [1:1083] 7318 7319 7320 7321 7322 ...
  ..$ temp    : num [1:1083] NA 25.8 NA NA NA NA NA NA NA 24.4 ...

如果我单独处理列表中的每个data.frame,我可以从temp和date创建一个zoo对象,如下所示:

> BallitoRaw.zoo <- zoo(datal$BallitoRaw.DAT$temp, datal$BallitoRaw.DAT$date)

zoo对象如下所示:

> head(BallitoRaw.zoo)
1990-01-14 1990-01-15 1990-01-16 1990-01-17 1990-01-18 1990-01-19 
        NA       25.8         NA         NA         NA         NA 

如何使用llply或apply(或类似)一次处理整个列表?

输出需要进入一个新的data.frames列表,或者一系列独立的data.frames(每个都在上面的动物园示例中命名)。请注意,日期列虽然是常规时间序列(天),但包含缺少日期(除了现有日期的临时值的NA);缺少的日期将由动物园功能填补。因此,带有zoo对象的输出data.frame将比原始对象更长。

非常感谢。

2 个答案:

答案 0 :(得分:3)

makeNamedZoo <- function(dfrm){ dfrmname <- deparse(substitute(dfrm))
  zooname <-dfrmname
   assign(zooname,   zoo(dfrm$temp, dfrm$date))
   return(get(zooname)) }
ListOfZoos <- lapply(dflist, makeNamedZoo)
names(ListOfZoos) <- paste( sub("DAT$", "", names(dflist) ), "zoo", sep="")

这是一个简单的测试用例:

df1 <- data.frame(a= letters[1:10], date=as.Date("2011-01-01")+0:9, temp=rnorm(10) )
df2 <- data.frame(a= letters[1:10], date=as.Date("2011-01-01")+0:9, temp=rnorm(10) )
dflist <- list(dfone.DAT=df1,dftwo.DAT=df2)
ListOfZoos <- lapply(dflist, makeNamedZoo) 
names(ListOfZoos) <- paste( sub("DAT$", "", names(dflist) ), "zoo", sep="")

$dfone.zoo
2011-01-01 2011-01-02 2011-01-03 2011-01-04 2011-01-05 2011-01-06 2011-01-07 
 0.7869056  1.6523928 -1.1131432  1.2261783  1.1843587  0.2673762 -0.4159968 
2011-01-08 2011-01-09 2011-01-10 
-1.2686391 -0.4135859 -1.4916291 

$dftwo.zoo
2011-01-01 2011-01-02 2011-01-03 2011-01-04 2011-01-05 2011-01-06 2011-01-07 
 0.7356612 -0.1263861 -1.6901240 -0.6441732 -1.4675871  2.3006544  1.0263354 
2011-01-08 2011-01-09 2011-01-10 
-0.8577544  0.6079986  0.6625564 

答案 1 :(得分:1)

这是实现我所需要的更简单方法:

tozoo <- function(x) zoo(x$temp, x$date) 
data1.zoo <- do.call(merge, lapply(split(data1, data1$Filename), tozoo))

结果是一个很好的动物园对象。