我正努力在熊猫数据框架上做一些数据争论。我已经被困在这个问题上2天了。
我有一个如下所示的数据框:
['a','e']
['b','f']
['c','g']
['d','h']
['a','i']
['b','j']
['c','k']
['d','l']
我需要把它变成这样的
['a',['e','i']]
['b',['f','j']]
['c',['g','k']]
['d',['h','l']]
所以基本上围绕第一列旋转原始数据框,然后从第二列创建字符串列表。
感谢
答案 0 :(得分:3)
您可以使用groupy/agg
:
import pandas as pd
data = [['a','e'], ['b','f'], ['c','g'], ['d','h'], ['a','i'], ['b','j'],
['c','k'], ['d','l']]
df = pd.DataFrame(data, columns=['first', 'second'])
print(df.groupby(['first']).agg(lambda x: x.tolist()))
产量
second
first
a [e, i]
b [f, j]
c [g, k]
d [h, l]