示例数据集:
import pandas as pd
df_test = pd.DataFrame({
'a': ['orange', 'lemon', 'banana', 'orange'],
'b': ['person_a', 'person_a', 'person_b', 'person_b']
})
这给出了:
a b
0 orange person_a
1 lemon person_a
2 banana person_b
3 orange person_b
我想要将其折叠,以便person_a
和person_b
中的每一个只是一行,并且水果形成每个人的列表:
a b
0 ['orange', 'lemon'] person_a
1 ['banana', 'orange'] person_b
如何?我可以粗略地把一些东西放在一起,但是它感觉很乱,而且非常慢。我的直觉表明,pandas
应该有一些原生的东西。