假设我有一个带有'A','B','C'作为列名的pandas DF
A B C
a1 b11 c11
a1 b12 c12
a2 b21 c21
a2 b22 c22
我可以按'A'分组,但我可以
A B C
a1 [b11,b12], [c11,c12]
a2 [b21,b22], [c21,c22]
没有任何聚合?希望订单(b12之前的b11)保留在原始表格中。
答案 0 :(得分:3)
我不知道怎么做你想要的,但也许这已足够接近了:
In [23]: df = pd.DataFrame({'A' : ['a1', 'a1', 'a2', 'a2'],
'B' : ['b11', 'b12', 'b21', 'b22'],
'C' : ['c11', 'c12', 'c21', 'c22']})
In [24]: grpA = df.groupby('A')
In [25]: a1 = grpA.get_group('a1')
使用它然后得到:
In [26]: a1['B'] # or a1.B
Out[26]:
0 b11
1 b12
Name: B
也:
In [39]: import numpy as np
In [40]: np.array(a1.B)
Out[40]: array([b11, b12], dtype=object)
最后:
In [41]: grpdA.get_group('a1').B.tolist() # leave off `.tolist()` to get a series
Out[41]: ['b11', 'b12']
希望有所帮助。
答案 1 :(得分:2)
In [46]: df.groupby('A').agg(lambda g: dict([(k,g[k].tolist()) for k in g]))
Out[46]:
B C
A
a1 ['b11', 'b12'] ['c11', 'c12']
a2 ['b21', 'b22'] ['c21', 'c22']