Question

考虑我有一个长格式的数据框，有三列。列x包含度量，y包含3个变量的名称，z包含2个级别。每个y变量都有重复的测量值：

df <- data.frame(x=c(1:12), y=rep(0:2, 4), z=rep(letters[1:2], 6))
df$y <- as.factor(df$y)
df <- arrange(df, y, z)
df

    x y z
1   1 0 a
2   7 0 a
3   4 0 b
4  10 0 b
5   5 1 a
6  11 1 a
7   2 1 b
8   8 1 b
9   3 2 a
10  9 2 a
11  6 2 b
12 12 2 b

我怎样才能得到df_wide这样的？

z  0  1  2
a  1  5  3
a  7  11 9
b  4  2  6
b  10 8  12

Answer 1

do.call(cbind, lapply(split(df, df$y), function(a)
    setNames(object = data.frame(a$x,
                                 row.names = paste0(as.character(a$z), 1:NROW(a))),
             nm = a$y[1])))
#    0  1  2
#a1  1  5  3
#a2  7 11  9
#b3  4  2  6
#b4 10  8 12

Answer 2

使用dcast()包中的rowid()和data.table函数，这就变成了“一线”：

library(data.table)
dcast(setDT(df), paste0(z, rowid(y, z)) ~ y, value.var = "x")

    z  0  1  2
1: a1  1  5  3
2: a2  7 11  9
3: b1  4  2  6
4: b2 10  8 12

如何将长数据帧转换为具有重复/重复的宽数据帧？

2 个答案: