Question

假设我有这个数据框：

name <- rep(LETTERS[seq(from=1, to =2)], each=3)
MeasA <- c(1:6)
MeasB <- c(7:12)

df <- data.frame(name, MeasA, MeasB)

我想重塑成一种没有像这样的idvar的格式：

MeasA_A MeasB_A MeasB_B MeasB_B
 1        7        4      10
 2        8        5      11
 3        9        6      12

我一直在阅读关于重塑和融化的文章：

Reshaping data frame with duplicates

http://seananderson.ca/2013/10/19/reshape.html

但是使用这些函数我需要指定一个idvar。我试过了：

tt <- reshape(df, timevar = "name", direction="wide")

和

tt <- dcast(df, ~name)

但他们显然不行。也许我需要使用split（Split data.frame based on levels of a factor into new data.frames）然后重塑？

Answer 1

我们可以split data.frame list使用＆＃39;名称＆＃39;列，cbind list个元素。我们可以使用sub或paste更改列名称。

res <- do.call(cbind,split(df[-1], df$name))
colnames(res) <- sub('([^.]+)\\.([^.]+)', '\\2_\\1', colnames(res))
res
#  MeasA_A MeasB_A MeasA_B MeasB_B
#1       1       7       4      10
#2       2       8       5      11
#3       3       9       6      12

如果我们想要使用dcast，我们可能需要创建按名称＆＃39;分组的序列列。在这里，我使用的是来自“数据表”的开发版本中的dcast。即v1.9.5，因为它可能需要多个value.var列。安装devel版本的说明是here。我们转换了＆＃39; data.frame＆＃39;到＆＃39; data.table＆＃39; （setDT(df)），创建序列列（＆＃39; i1＆＃39;），按名称＆＃39;分组，使用dcast并指定value.var列。

library(data.table)#v1.9.5+
setDT(df)[, i1:= 1:.N, by = name]
dcast(df, i1~name, value.var=c('MeasA', 'MeasB'))[, i1:= NULL][]
#   MeasA_A MeasA_B MeasB_A MeasB_B
#1:       1       4       7      10
#2:       2       5       8      11
#3:       3       6       9      12

以类似的方式，我们可以使用reshape中的base R。我们使用ave创建序列列，并将其用作＆＃39; idvar in reshape`。

df1 <- transform(df, i1= ave(seq_along(name), name, FUN=seq_along))
reshape(df1, idvar='i1', timevar='name', direction='wide')[-1]
#  MeasA.A MeasB.A MeasA.B MeasB.B
#1       1       7       4      10
#2       2       8       5      11
#3       3       9       6      12

重塑数据框，没有idvar - R.

1 个答案: