我正在尝试将长数据格式转换为R中的宽数据格式 例如,我有以下数据框:
a = rep(c("A","B","C","D"),4)
b = rep(c("COL1","COL2","COL3","COL4"),4)
val = 101:116
df = as.data.frame(cbind(a,b,val))
df
我希望看到结果为:
row <- as.list(levels(df$a))
col <- as.list(levels(df$b))
test <- data.frame()
i = 1
for (j in 1:4) {
for(k in 1:4){
test[j,k] = df$val[i]
i = i + 1
}
}
colnames(test) <- c("COL1","COL2","COL3","COL4")
rownames(test) <- c("A","B","C","D")
test
如果您能使用一些方便的功能建议一个优雅的解决方案,我将不胜感激。 谢谢, 卡西姆
答案 0 :(得分:3)
使用unstack
:
df.out <- unstack(df, val ~ b)
rownames(df.out) <- unique(df$a)
使用reshape2
,获取id
列需要一些技巧,因为您的标识符不唯一标识值。
dcast(transform(df, id=rep(1:4, each=4)), id ~ b, value.var="val")
然后您可以类似地添加行名称。
答案 1 :(得分:3)
如果你的id列真的很独特,你可以使用reshape
reshape(data=df, direction = "wide", idvar = "a", timevar = "b", v.names = "val")
但由于它们并非独一无二,以下内容将帮助您顺利开始。
df$fakeid <- rep(1:4, each=4)
reshape(data=df, direction = "wide", idvar = "fakeid", drop = "a", timevar = "b", v.names = "val")