我有一个具有以下格式的数据框-
Timestamp Type
1 4
2 4
3 4
4 4
5 5
6 5
7 5
8 4
9 4
10 3
11 3
12 4
我需要“压缩”具有相同“类型”值的行。输出应如下所示-
Timestamp Type
1 4
5 5
8 4
10 3
12 4
所以基本上,我需要保留每个组的第一行。我尝试使用分组依据,
df_new = df.groupby(df['Type'], sort=False).aggregate('first')
但是将所有4组组合在一起,结果类似
Timestamp Type
1 4
5 5
10 3
由于大小(〜600,000行),我想避免使用for循环/遍历整个数据帧。有没有更快的方法来达到上述效果?