将table.table中的不同列值组合在一起,形成另一个表的行值

时间:2017-03-11 19:21:06

标签: r data.table dplyr aggregate data-munging

我有下表DT-1。列代表不同的状态

 id    col1   col2  col3  col4  col5 col6
qw-1   ABC   XYZ    QRT   RWQ   OIP  KIJ
qw-2   WET   ERT    YUP   TIP   IUR  ETY
qw-3   QRT   ERT    RWQ   YUP   0     0
qw-4   XYZ   QRT    RWQ    0    0     0
qw-5   YUP    0     0     0     0     0 

我想形成另一个表DT-2,其中表中的行看起来如下所示:

 1   ABC   XYZ
 2   XYZ   QRT
 3   QRT   RWQ
 4   RWQ   OIP
 5   OIP   KIJ
 6   WET   ERT
 7   ERT   YUP
 8   YUP   TIP
 9   TIP   IUR
 10  IUR   ETY
 11  QRT   ERT
 12  RWQ   YUP
 13  XYZ   QRT
 14  QRT    RWQ
 15  YUP

第二表的行1-5由第一表的第一行形成。类似地,行6-10,11-12,13-14和&第二,第三,第四和第二表格中的第十五个表1的第5行。

是否有任何data.table方法或任何其他R包来执行此操作?

1 个答案:

答案 0 :(得分:1)

我们可以转置数据集,删除第一个和最后一个元素,转换为vector,然后在data.frame中创建两列

library(data.table)
m1 <- t(setDF(DT1)[-1])
d1 <- data.frame(col1= c(m1[-length(m1)]), col2 = c(m1[-1]), stringsAsFactors=FALSE)

或者我们可以melt然后按操作进行分组

dN <- setDT(melt(t(DT1[-1])))[, .(col1 = value[-.N], 
               col2 = value[-1]), Var2][, Var2 := NULL][]