我有一个看起来像这样的数据框
DG:
thing1 thing2 thing3 thing4 thing5 thing6 thing7 ID
NAN 1 NAN NAN NAN NAN NAN 222
NAN NAN 3 NAN NAN NAN NAN 222
NAN NAN NAN 2 NAN NAN NAN 222
3 NAN NAN NAN NAN NAN 3 222
NAN NAN NAN NAN NAN NAN NAN 222
NAN NAN NAN NAN 4 NAN NAN 222
NAN NAN NAN NAN NAN 4 NAN 222
NAN 3 NAN 2 NAN NAN NAN 555
NAN NAN 3 NAN NAN NAN NAN 555
NAN NAN NAN NAN NAN NAN NAN 555
当我像这样做一个小组:
dg = dg.groupby('ID').max().reset_index()
它产生以下输出,省略两列,如下所示:
ID thing2 thing3 thing4 thing5 thing7
222 1 3 2 4 3
555 3 2
数据帧遵循该模式,但我不知道为什么要删除两列
NAN值为np.nan
答案 0 :(得分:1)
我发现我有一个字符串" N / A"在我的np.nan值中间的值。 Lesson是具有整数的字符串,可能会导致列在执行groupby函数时消失。那些没有" N / A"在执行groupby函数时,字符串没有消失。当我更换" N / A"使用np.nan的字符串,当我执行groupby时,列没有消失