我有一堆数据框存储在一个列表中。我的目标是格式化列表中的每个数据框,使特定列中的值变为列名。由于我希望转换列表中的每个数据框,因此我尝试在spread
中将tidyverse
函数应用于列表中的所有元素。但是,我收到以下错误:
the condition has length > 1 and only the first element will be usedError: `var` must evaluate to a single number or a column name, not a double vector
这是我从How to control new variables' names after tidyr's spread?借来的一个虚拟例子,以促进讨论:
创建虚拟数据框:
df1 <- data.frame(
id = rep(1:3, rep(2,3)),
year = rep(c(2012, 2013), 3),
value = runif(6)
)
df2 <- data.frame(
id = rep(4:6, rep(2,3)),
year = rep(c(2012, 2013), 3),
value = runif(6)
)
将数据框存储在列表中:
list <- list(df1, df2)
list[[1]]
# id year value
#1 1 2012 0.09668064
#2 1 2013 0.62739399
#3 2 2012 0.45618433
#4 2 2013 0.60347152
#5 3 2012 0.84537624
#6 3 2013 0.33466030
list[[1]]
的理想结果:
# id 2012 2013
#1 1 0.09668064 0.6273940
#2 2 0.45618433 0.6034715
#3 3 0.84537624 0.3346603
我尝试在列表中存储为元素的所有数据帧上传播键/值:
library(tidyverse)
for (i in 1:2){
list[[i]] %>% spread(key = list[[i]][,2], value = list[[i]][,3])
}
答案 0 :(得分:0)
最好不要使用key/value
的索引,因为列顺序的任何更改都会产生错误的结果,但如果位置已知,那么
library(tidyverse)
res <- map(list, ~ .x %>%
spread(key = 2, value = 3))
与作为列名传递的键/值进行比较。我们建议使用名称
resOld <- map(list, ~ .x %>%
spread(key = year, value = value))
identical(res, resOld)
#[1] TRUE