Question

我正在尝试清理一些数据

数据框目前看起来像这样：

    id  data data2
0   12  NaN  50.0
1   12  a    50.0
2   12  a    NaN
3   52  b    NaN
4   52  NaN  20.0
5   52  NaN  20.0

我想要删除行以删除重复的条目，并在此特定情况下仅保留对ID的有效分组，忽略NaN以及以上：

    id  data data2
0   12  a    50
1   52  b    20

Answer 1

你需要：

df.groupby('id', as_index=False).first()

输出：

    id  data    data2
0   12  a      50.0
1   52  b      20.0