我的df通常看起来像这样:
ID IDDate EmployeeID CreateUserID
24 2017-09-11 00:00:00.000 0907036 Afior
25 2017-09-12 00:00:00.000 0907036 Afior
26 2017-09-16 00:00:00.000 1013842 JHyde
27 2017-09-16 00:00:00.000 0907036 Afior
28 2017-10-16 00:00:00.000 1013842 JHyde
29 2017-10-19 00:00:00.000 0778925 MPet
30 2017-10-19 00:00:00.000 1013842 JHyde
我需要创建一个变量,该变量显示每个EmployeeID的观察顺序。我对max(date)
和min(date)
有所了解,但找不到有关如何在不同地点之间进行交流的任何信息。我想象它将需要groupby
和其他我不知道的功能的组合。
理想情况下,我的输出应如下所示:
ID IDDate EmployeeID CreateUserID obs_place
24 2017-09-11 00:00:00.000 0907036 Afior 1
25 2017-09-12 00:00:00.000 0907036 Afior 2
26 2017-09-16 00:00:00.000 1013842 JHyde 1
27 2017-09-16 00:00:00.000 0907036 Afior 3
28 2017-10-16 00:00:00.000 1013842 JHyde 2
29 2017-10-19 00:00:00.000 0778925 MPet 1
30 2017-10-19 00:00:00.000 1013842 JHyde 3