我正在尝试清理一些数据
数据框目前看起来像这样:
id data data2
0 12 NaN 50.0
1 12 a 50.0
2 12 a NaN
3 52 b NaN
4 52 NaN 20.0
5 52 NaN 20.0
我想要删除行以删除重复的条目,并在此特定情况下仅保留对ID的有效分组,忽略NaN以及以上:
id data data2
0 12 a 50
1 52 b 20
答案 0 :(得分:2)
你需要:
df.groupby('id', as_index=False).first()
输出:
id data data2
0 12 a 50.0
1 52 b 20.0