Python Groupby省略列

时间:2016-09-14 17:06:50

标签: python pandas dataframe

我有一个看起来像这样的数据框

DG:

thing1 thing2 thing3 thing4 thing5 thing6 thing7 ID 
NAN      1      NAN   NAN     NAN   NAN     NAN  222
NAN      NAN     3    NAN     NAN   NAN     NAN  222
NAN      NAN    NAN    2      NAN   NAN     NAN  222
 3       NAN    NAN   NAN     NAN   NAN      3   222
NAN      NAN    NAN   NAN     NAN   NAN     NAN  222
NAN      NAN    NAN   NAN      4    NAN     NAN  222
NAN      NAN    NAN   NAN     NAN    4      NAN  222
NAN       3     NAN     2     NAN   NAN     NAN  555
NAN      NAN     3    NAN     NAN   NAN     NAN  555
NAN      NAN    NAN   NAN     NAN   NAN     NAN  555

当我像这样做一个小组:

dg = dg.groupby('ID').max().reset_index()

它产生以下输出,省略两列,如下所示:

ID   thing2 thing3 thing4  thing5  thing7
222    1      3      2       4       3
555           3      2 

数据帧遵循该模式,但我不知道为什么要删除两列

NAN值为np.nan

1 个答案:

答案 0 :(得分:1)

我发现我有一个字符串" N / A"在我的np.nan值中间的值。 Lesson是具有整数的字符串,可能会导致列在执行groupby函数时消失。那些没有" N / A"在执行groupby函数时,字符串没有消失。当我更换" N / A"使用np.nan的字符串,当我执行groupby时,列没有消失