我正在尝试基于每n行的列对数据帧进行分组。输入是:
A
0 1
1 2
3 1
4 2
5 3
6 2
7 1
8 2
9 2
我希望每3行按'A'列分组,因此我的输出应为:
A
0 1
1 2
4 2
5 3
7 1
8 2
在重置索引后可以获得:
A
0 1
1 2
2 2
3 3
4 1
5 2
谢谢。
答案 0 :(得分:1)
... IIUC
df.groupby((np.array(range(len(df))))//3).A.apply(lambda x : x.drop_duplicates())
Out[156]:
0 0 1
1 2
1 4 2
5 3
2 7 1
8 2
Name: A, dtype: int64