熊猫:如何通过公共密钥折叠df行

时间:2017-09-20 11:01:55

标签: python pandas dataset data-manipulation

示例数据集:

import pandas as pd
df_test = pd.DataFrame({
    'a': ['orange', 'lemon', 'banana', 'orange'],
    'b': ['person_a', 'person_a', 'person_b', 'person_b']
})

这给出了:

        a         b
0  orange  person_a
1   lemon  person_a
2  banana  person_b
3  orange  person_b

我想要将其折叠,以便person_aperson_b中的每一个只是一行,并且水果形成每个人的列表:

                      a         b
0   ['orange', 'lemon']  person_a
1  ['banana', 'orange']  person_b

如何?我可以粗略地把一些东西放在一起,但是它感觉很乱,而且非常慢。我的直觉表明,pandas应该有一些原生的东西。

编辑:在这里回答:grouping rows in list in pandas groupby

0 个答案:

没有答案