将输出从lapply提取到数据帧

时间:2012-05-14 20:56:14

标签: r list dataframe

我有一些R代码,它使用以下代码对当前目录中的所有文件执行一些数据提取操作:

files <- list.files(".", pattern="*.tts")
results <- lapply(files, data_for_time, "17/06/2006 12:00:00")

来自lapply的输出如下(使用dput()提取) - 基本上是一个完整的向量列表:

list(c("amer", "14.5"), c("appl", "14.2"), c("brec", "13.1"), 
c("camb", "13.5"), c("camo", "30.1"), c("cari", "13.8"), 
c("chio", "21.1"), c("dung", "9.4"), c("east", "11.8"), c("exmo", 
"12.1"), c("farb", "14.7"), c("hard", "15.6"), c("herm", 
"24.3"), c("hero", "13.3"), c("hert", "11.8"), c("hung", 
"26"), c("lizr", "14"), c("maid", "30.4"), c("mart", "8.8"
), c("newb", "14.7"), c("newl", "14.3"), c("oxfr", "13.9"
), c("padt", "10.3"), c("pbil", "13.6"), c("pmtg", "11.1"
), c("pmth", "11.7"), c("pool", "14.6"), c("prae", "11.9"
), c("ral2", "12.2"), c("sano", "15.3"), c("scil", "36.2"
), c("sham", "12.9"), c("stra", "30.9"), c("stro", "14.7"
), c("taut", "13.7"), c("tedd", "22.3"), c("wari", "12.7"
), c("weiw", "13.6"), c("weyb", "8.4"))

但是,我想将此输出作为包含两列的数据框处理:一列用于字母代码("amer""appl"等),另一列用于数字({{1} },14.5等。)

不幸的是,14.2似乎不适用于列表中嵌套向量的输入。我该如何转换呢?我是否需要更改函数as.data.frame返回其值的方式?目前它只返回data_for_time。或者有一种很好的方法可以将这种输出转换为数据帧吗?

4 个答案:

答案 0 :(得分:39)

如果results是您的列表,请尝试此操作:

> as.data.frame(do.call(rbind, results))

     V1   V2
1  amer 14.5
2  appl 14.2
3  brec 13.1
4  camb 13.5
...

答案 1 :(得分:10)

一个选项可能是使用 plyr 包中的ldply函数,它会将内容重新组合成数据框。

使用它的一个简单例子:

ldply(1:10,.fun = function(x){c(runif(1),"a")})
                    V1 V2
1    0.406373084755614  a
2    0.456838687881827  a
3    0.681300171650946  a
4    0.294320539338514  a
5    0.811559669673443  a
6    0.340881009353325  a
7    0.134072444401681  a
8  0.00850683846510947  a
9    0.326008745934814  a
10    0.90791508089751  a

但请注意,如果您将变量类型与c()混合使用,则可能 希望更改您的函数以仅返回data.frame(name= name,value = value)而不是c(name,value) 。否则一切都将被强制转换为角色(正如我上面的例子中所示)。

答案 2 :(得分:3)

inp <- list(c("amer", "14.5"), c("appl", "14.2"), .... # did not see need to copy all

data.frame( first= sapply( inp, "[", 1), 
            second =as.numeric( sapply( inp, "[", 2) ) )

   first second
1   amer   14.5
2   appl   14.2
3   brec   13.1
4   camb   13.5
5   camo   30.1
6   cari   13.8
snipped output

答案 3 :(得分:1)

因为和尼尔顿接受了回应,我正在给予回应,而乔兰接受了我能想到的唯一其他合理的回应,因为我应该写一篇论文,这是一个荒谬的回答:

#I named your list LIST
LIST2 <-  LIST[[1]]
lapply(2:length(LIST), function(i) {LIST2 <<- rbind(LIST2, LIST[[i]])})
data.frame(LIST2)