我更喜欢data.table
,tidyr
或dplyr
的内容,因为我有一个非常大的数据集。
关于数据,我有一个如下所示的数据集:
GVar1 Stop1 Stop2 Stop3 Stop4 (...)
1 A NA NA NA (...)
1 NA B D NA (...)
2 D J E NA (...)
3 F NA NA NA (...)
3 NA B NA NA (...)
3 NA NA C NA (...)
3 NA NA NA J (...)
请注意,有超过4个停止列,它们可能会因数据集而异。但是,它们总是被称为Stop后跟一个数字。
我们的想法是通过GVar1
和所有列进行合并,最终得到类似的结果:
GVar1 Stop1 Stop2 Stop3 Stop4 (...)
1 A B D NA (...)
2 D J E NA (...)
3 F B C J (...)
到目前为止,我已经summarise
dplyr
,DT[.,]
来自data.table
以及其他一些选项,但实际上没有任何效果。
我觉得我应该使用dplyr
的{{1}}但到目前为止我无法得到我想要的结果,因为我有一些未指定的列。