Question

如果标题令人误解，我感到非常抱歉，因为我不知道如何正确解释（不确定术语是什么）。

我有一些基本上像这样的数据：

a<-c('AA01','AA02','AB01')
b<-c('AA','AA','AB')
c<-c('Y','N','N')
d<-c(1,2,3)
e<-c(4,5,6)
f<-c(7,8,9)
g<-c(11,22,33)
h<-c(44,55,66)
i<-c(77,88,99)
cols<-c("SampID","Characteristic1","Characteristic2","Mes1Rep1","Mes1Rep2","Mes1Rep3","Mes2Rep1","Mes2Rep2","Mes2Rep3")


df<-data.frame(a,b,c,d,e,f,g,h,i)
colnames(df)<-cols
df

  SampID Characteristic1 Characteristic2 Mes1Rep1 Mes1Rep2 Mes1Rep3 Mes2Rep1 Mes2Rep2 Mes2Rep3
1   AA01              AA               Y        1        4        7       11       44       77
2   AA02              AA               N        2        5        8       22       55       88
3   AB01              AB               N        3        6        9       33       66       99

在此示例中，Mes1Rep1引用一种测量类型的第一个副本，Mes2Rep2引用该测量类型的第二个副本，依此类推。我想将重复项安排在列中。像这样：

  SampID Characteristic1 Characteristic2 Replicates Measurement1 Measurement2
1   AA01              AA               Y       Rep1            1           11
2   AA01              AA               Y       Rep2            4           44
3   AA01              AA               Y       Rep3            7           77
4   AA02              AA               N       Rep1            2           22
5   AA02              AA               N       Rep2            5           55
6   AA02              AA               N       Rep3            8           88
7   AB01              AB               N       Rep1            3           33
8   AB01              AB               N       Rep2            6           66
9   AB01              AB               N       Rep3            9           99

我将如何在R中执行此操作？我想我可以自己对行进行转置，但是有没有办法自动复制冗余值（例如本示例中的“ SampID”）？

还是别无选择，只能手动执行此操作？

感谢您抽出宝贵的时间阅读本文档，并提供了帮助和/或指导！

Answer 1

我们可以使用melt中的data.table，这可能需要多个measure patterns

library(data.table)
melt(setDT(df), measure = patterns("Mes1", "Mes2"), 
   variable.name = "Replicates", 
    value.name = c("Measurement1", "Measurement2"))[
      order(SampID)][, Replicates := paste0("Rep", Replicates)][]
#   SampID Characteristic1 Characteristic2 Replicates Measurement1 Measurement2
#1:   AA01              AA               Y       Rep1            1           11
#2:   AA01              AA               Y       Rep2            4           44
#3:   AA01              AA               Y       Rep3            7           77
#4:   AA02              AA               N       Rep1            2           22
#5:   AA02              AA               N       Rep2            5           55
#6:   AA02              AA               N       Rep3            8           88
#7:   AB01              AB               N       Rep1            3           33
#8:   AB01              AB               N       Rep2            6           66
#9:   AB01              AB               N       Rep3            9           99

或使用reshape中的base R

reshape(df, idvar = c("SampID", "Characteristic1", "Characteristic2"), 
       varying = list(4:6, 7:9), direction = "long")

R：将存储在行中的不同测量值的副本转置为单列

1 个答案: