R,如何堆叠和保留因子

时间:2011-02-21 16:48:42

标签: r

R问题: 如何堆叠两列或多列数字保留一个因子

我有data.frame这样:

patient analyte1value analyte2value analyte3value  
pt1 1 3 5  
pt2 2 6 7  
pt3 9 10 2  
...  

我知道我可以使用stack(select=c(columnnames)),但我失去了耐心因素。

我想离开:

pt1 1 analyte1  
pt1 3 analyte2  
pt1 5 analyte3  
pt2 2 analyte1  
pt2 6 analyte2  
...

(我怀疑我需要plyr或类似的东西......)

感谢。

2 个答案:

答案 0 :(得分:8)

一个选项是Hadley的其他套餐之一:reshape2

> require(reshape2)
> dat
  patient analyte1 analyte2 analyte3
1     pt1        1        3        5
2     pt2        2        6        7
3     pt3        9       10        2
> melt(dat, id = "patient")
  patient variable value
1     pt1 analyte1     1
2     pt2 analyte1     2
3     pt3 analyte1     9
4     pt1 analyte2     3
5     pt2 analyte2     6
6     pt3 analyte2    10
7     pt1 analyte3     5
8     pt2 analyte3     7
9     pt3 analyte3     2
> str(melt(dat, id = "patient"))
'data.frame':   9 obs. of  3 variables:
 $ patient : Factor w/ 3 levels "pt1","pt2","pt3": 1 2 3 1 2 3 1 2 3
 $ variable: Factor w/ 3 levels "analyte1","analyte2",..: 1 1 1 2 2 2 3 3 3
 $ value   : int  1 2 9 3 6 10 5 7 2

可以使用基础R中的reshape()以更长篇的方式做到这一点:

reshape(dat, direction = "long", sep = "", varying = 2:4,
        times = names(dat)[2:4], idvar = "patient",
        timevar = "variable", v.names = "value")

主要区别在于variable不是基础reshape()的因素。我认为用户不友好是写reshape2 ...

的动机

答案 1 :(得分:2)

如果我理解正确,您希望将reshape数据帧格式化为长格式。

reshape(df,varying=list(2:4),times=names(df)[2:4],
  idvar="patient",v.names="value",direction="long")