我有一个关于处理数据帧的问题。看起来很基本,但我不太明白。我正在尝试按以下方式更改数据。
我认为这不是简单的转置。 R需要识别每个数据的bin值相同。这就是为什么我认为我在下面尝试过的“ dcast”和被标记为重复项的问题可能不正确的原因?
原始
Gen value Date Bin
Gen1 21 01/03/2018 1
Gen2 23 01/03/2018 1
Gen3 26 01/03/2018 1
Gen1 21 02/03/2018 0
Gen2 29 02/03/2018 0
Gen3 16 02/03/2018 0
Gen1 51 03/03/2018 1
Gen2 73 03/03/2018 1
Gen3 9 03/03/2018 1
新表格
Date Gen1 Gen2 Gen3 Bin
01/03/2018 21 21 51 1
02/03/2018 23 29 73 0
03/03/2018 26 16 9 1
*注意-bin为1或0是从日期算起的。
感谢您的帮助。
我得到的最接近的命令是此命令,但是插入了N / a个字段。
aa <-dcast(data,date + bin〜value,value.var =“ Gen”)
dcast函数给出以下结果。有没有办法做到这一点而没有得到N / a?根据上表。
date bin value Gen1 Gen2 Gen3
1 2018-03-01 0 23 NA 23 NA
2 2018-03-01 0 73 NA 73 NA
3 2018-03-01 1 21 21 NA NA
4 2018-03-01 1 26 NA NA 26
5 2018-03-01 1 51 51 NA NA
6 2018-03-02 0 16 NA NA 16
7 2018-03-02 0 21 21 NA NA
8 2018-03-02 0 29 NA 29 NA
9 2018-03-02 1 6 NA NA 6