按ID和日期合并行,并采用两个变量的最大值和通用值

时间:2019-11-02 09:30:00

标签: pandas

我有带有ID,每个ID的日期和每个日期的时间的数据框。另外,二进制变量(Y)的值为1或0,另一个是标称变量(X)。我想按ID和日期合并行,并采用每个(ID,日期)的最大Y值,并采用每个(ID,日期)的通用X值,但不考虑0值级别。

注意:ID,日期和时间是索引,并且已对其进行排序。

数据说明:

ID  Date        Time    Y       X
1   08/27/2019  18:00   0       123
                19:00   0       123
                20:00   1       456
2   08/27/2019  18:00   0       0
                19:00   0       0
                20:00   1       456
3   08/27/2019  18:00   1       123
                19:00   0       0
                20:00   1       456
3   08/28/2019  18:00   0       0
                19:00   0       0
                20:00   0       0

预期结果:

ID  Date        Y       X
1   08/27/2019  1       123
2   08/27/2019  1       456
3   08/27/2019  1       123
3   08/28/2019  0       0

注意:对于ID#3的首次观察(于08/27/2019),采用123是因为它更早(就时间而言)。

0 个答案:

没有答案