我有带有ID,每个ID的日期和每个日期的时间的数据框。另外,二进制变量(Y)的值为1或0,另一个是标称变量(X)。我想按ID和日期合并行,并采用每个(ID,日期)的最大Y值,并采用每个(ID,日期)的通用X值,但不考虑0值级别。
注意:ID,日期和时间是索引,并且已对其进行排序。
数据说明:
ID Date Time Y X
1 08/27/2019 18:00 0 123
19:00 0 123
20:00 1 456
2 08/27/2019 18:00 0 0
19:00 0 0
20:00 1 456
3 08/27/2019 18:00 1 123
19:00 0 0
20:00 1 456
3 08/28/2019 18:00 0 0
19:00 0 0
20:00 0 0
预期结果:
ID Date Y X
1 08/27/2019 1 123
2 08/27/2019 1 456
3 08/27/2019 1 123
3 08/28/2019 0 0
注意:对于ID#3的首次观察(于08/27/2019),采用123是因为它更早(就时间而言)。