按R中的组转置数据

时间:2013-06-29 16:05:34

标签: r reshape data-manipulation

我有以下结构的数据:

x <- read.table(header=T, text="
X Y D S
a e 1 10
a e 2 20
a f 1 50
b c 1 40
b c 2 30
b c 3 60
b d 1 10 
b d 2 20")

我希望得到以下结果:

X Y   1   2   3
a e  10  20
a f  50
b c  40  30  60
b d  10  20

对于列XY的每个组合,我想按列S中的顺序转置列D中的数据。

我认为xtabs()会起作用,但我不这么认为,我最好的版本是:

xtabs(formula=S~Y+D,data=x)

结果:

   D
Y    1  2  3
  c 40 30 60
  d 10 20  0
  e 10 20  0
  f 50  0  0

3 个答案:

答案 0 :(得分:10)

require(reshape2)
dcast(x, X + Y ~ D, value.var="S")

如果您想使用0而不是NA(这是默认值)填充空条目,那么,

dcast(x, X + Y ~ D, value.var="S", fill=0)

答案 1 :(得分:7)

基础R的解决方案:

> reshape(x, timevar="D", idvar=c("X","Y"), direction="wide")
  X Y S.1 S.2 S.3
1 a e  10  20  NA
3 a f  50  NA  NA
4 b c  40  30  60
7 b d  10  20  NA

答案 2 :(得分:3)

另外两个答案非常好,但是对于它的价值,因为你提到你开始尝试xtabs,你 可以 接近通过xtabsftable的组合,您在寻找什么。但是,结果将包括所有因子水平

ftable(xtabs(S ~ ., x))
#     D  1  2  3
# X Y           
# a c    0  0  0
#   d    0  0  0
#   e   10 20  0
#   f   50  0  0
# b c   40 30 60
#   d   10 20  0
#   e    0  0  0
#   f    0  0  0

或者,您可以这样做:

data.frame(unique(x[1:2]), 
           as.data.frame.matrix(xtabs(S ~ do.call(paste, x[1:2]) + D, x)))
#   X Y X1 X2 X3
# 1 a e 10 20  0
# 3 a f 50  0  0
# 4 b c 40 30 60
# 7 b d 10 20  0