通过合并相似列值的每个“组”来压缩数据框

时间:2019-02-16 00:41:34

标签: python pandas dataframe group-by compression

我有一个具有以下格式的数据框-

Timestamp    Type
    1          4
    2          4
    3          4
    4          4
    5          5
    6          5
    7          5
    8          4
    9          4
   10          3
   11          3
   12          4

我需要“压缩”具有相同“类型”值的行。输出应如下所示-

Timestamp    Type
    1          4
    5          5
    8          4
   10          3
   12          4

所以基本上,我需要保留每个组的第一行。我尝试使用分组依据,

df_new = df.groupby(df['Type'], sort=False).aggregate('first')

但是将所有4组组合在一起,结果类似

Timestamp    Type
    1          4
    5          5
   10          3

由于大小(〜600,000行),我想避免使用for循环/遍历整个数据帧。有没有更快的方法来达到上述效果?

0 个答案:

没有答案