我正在寻找一种快速的方法来在以下格式的列表之间来回:
$`a`
[1] 1 2 3
$`b`
[1] 4 5 6
来自/来自以下格式的data.frame:
name x
1 a 1
2 a 2
3 a 3
4 b 4
5 b 5
6 b 6
(在这种情况下,不要真正关心列的名称。)
以上是R格式中使用的数据框:
df <- data.frame(name=c(rep("a",3),rep("b",3)), x=c(1:3,4:6))
同样,我正在寻找两个独立的操作:一个用于将上述data.frame转换为一个列表,另一个用于将其转换回data.frame。
答案 0 :(得分:38)
在基础R中使用stack
和unstack
:
x <- data.frame(a=1:3, b=4:6)
x
a b
1 1 4
2 2 5
3 3 6
使用stack
从宽到高,即将矢量叠加在一起。
y <- stack(x)
y
values ind
1 1 a
2 2 a
3 3 a
4 4 b
5 5 b
6 6 b
使用unstack
执行相反操作。
unstack(y)
a b
1 1 4
2 2 5
3 3 6
如果您的数据结构比您描述的更复杂,stack
和unstack
可能不再合适。在这种情况下,您必须在基础R中使用reshape
,或在melt
包中使用dcast
和reshape2
。
答案 1 :(得分:8)
可能是这样的:
X <- split(df$x, df$name)
data.frame(name = rep(names(X), sapply(X, length)),
x=do.call('c', X))
编辑: 我决定将Andrie和我的解决方案合并到一个看起来正如OP要求的那个解决方案中。话虽如此,我不太了解我会以这种方式处理数据而不是Andrie如何处理数据的情况,因为无论如何数据框都是等长矢量列表。
# Your data set
df <- data.frame(name=c(rep("a",3),rep("b",3)), x=c(1:3,4:6))
# converting it to list of vectors
X <- split(df[, 2], df[, 1])
# converting it to a dataframe
Y <- stack(X)[, 2:1]; names(Y) <- names(df)
# Take Y and feed it back to these lines to show it
# switches back and forth
(X <- split(Y[, 2], Y[, 1]))
Y <- stack(X)[, 2:1]; names(Y) <- names(df);Y
答案 2 :(得分:4)
我希望对@Tyler Rinker的建议做出有希望的重要评论
X <- split(df$x, df$name)
可以更普遍地完成
X <- split(df, df$name)
@Tyler Rinker的split()解释与R cookbook匹配
指定可以对矢量进行分组,而实际上可以对整个数据帧进行分组。我认为对数据帧进行分组而不是向量分组将是更有价值的工具(事实上是什么让我对这篇文章有所了解)。
(df <- data.frame(name=c(rep("a",3),rep("b",3), rep("c",3)), x=c(1:3,4:6, 7:9)))
(X <- split(df, df$name))
HTH。
答案 3 :(得分:0)
另一个选择是enframe
中的tibble
library(tidyverse)
enframe(lst1) %>%
unnest
lst1 <- list(a=1:3, b=4:6)