如果标题令人误解,我感到非常抱歉,因为我不知道如何正确解释(不确定术语是什么)。
我有一些基本上像这样的数据:
a<-c('AA01','AA02','AB01')
b<-c('AA','AA','AB')
c<-c('Y','N','N')
d<-c(1,2,3)
e<-c(4,5,6)
f<-c(7,8,9)
g<-c(11,22,33)
h<-c(44,55,66)
i<-c(77,88,99)
cols<-c("SampID","Characteristic1","Characteristic2","Mes1Rep1","Mes1Rep2","Mes1Rep3","Mes2Rep1","Mes2Rep2","Mes2Rep3")
df<-data.frame(a,b,c,d,e,f,g,h,i)
colnames(df)<-cols
df
SampID Characteristic1 Characteristic2 Mes1Rep1 Mes1Rep2 Mes1Rep3 Mes2Rep1 Mes2Rep2 Mes2Rep3
1 AA01 AA Y 1 4 7 11 44 77
2 AA02 AA N 2 5 8 22 55 88
3 AB01 AB N 3 6 9 33 66 99
在此示例中,Mes1Rep1引用一种测量类型的第一个副本,Mes2Rep2引用该测量类型的第二个副本,依此类推。我想将重复项安排在列中。像这样:
SampID Characteristic1 Characteristic2 Replicates Measurement1 Measurement2
1 AA01 AA Y Rep1 1 11
2 AA01 AA Y Rep2 4 44
3 AA01 AA Y Rep3 7 77
4 AA02 AA N Rep1 2 22
5 AA02 AA N Rep2 5 55
6 AA02 AA N Rep3 8 88
7 AB01 AB N Rep1 3 33
8 AB01 AB N Rep2 6 66
9 AB01 AB N Rep3 9 99
我将如何在R中执行此操作?我想我可以自己对行进行转置,但是有没有办法自动复制冗余值(例如本示例中的“ SampID”)?
还是别无选择,只能手动执行此操作?
感谢您抽出宝贵的时间阅读本文档,并提供了帮助和/或指导!
答案 0 :(得分:1)
我们可以使用melt
中的data.table
,这可能需要多个measure
patterns
library(data.table)
melt(setDT(df), measure = patterns("Mes1", "Mes2"),
variable.name = "Replicates",
value.name = c("Measurement1", "Measurement2"))[
order(SampID)][, Replicates := paste0("Rep", Replicates)][]
# SampID Characteristic1 Characteristic2 Replicates Measurement1 Measurement2
#1: AA01 AA Y Rep1 1 11
#2: AA01 AA Y Rep2 4 44
#3: AA01 AA Y Rep3 7 77
#4: AA02 AA N Rep1 2 22
#5: AA02 AA N Rep2 5 55
#6: AA02 AA N Rep3 8 88
#7: AB01 AB N Rep1 3 33
#8: AB01 AB N Rep2 6 66
#9: AB01 AB N Rep3 9 99
或使用reshape
中的base R
reshape(df, idvar = c("SampID", "Characteristic1", "Characteristic2"),
varying = list(4:6, 7:9), direction = "long")