熊猫数据框使每个唯一的ID号都成为NAT

时间:2019-01-21 10:41:58

标签: python pandas dataframe

我有一个数据框,对于每个不连续的ID,将第一个“ Diff”列设为NaT,例如,我的数据开始看起来像

index   DEVICE_ID      DIFF
0        12             Nat
1        12              20
2        12              30
3        13              40
4        13              40
5        13              21
6        14               9
7        14              10    

但是我希望结果数据框看起来像下面的数据框

index   DEVICE_ID      DIFF
0        12             Nat
1        12              20
2        12              30
3        13             Nat
4        13              40
5        13              21
6        14             Nat
7        14              10

很抱歉措辞不好的问题

1 个答案:

答案 0 :(得分:3)

使用df.duplicated()df.loc

df.loc[~df.DEVICE_ID.duplicated(),'DIFF'] = pd.NaT
>>df

   index  DEVICE_ID DIFF
0      0         12  NaT
1      1         12   20
2      2         12   30
3      3         13  NaT
4      4         13   40
5      5         13   21
6      6         14  NaT
7      7         14   10