Question

我正努力在熊猫数据框架上做一些数据争论。我已经被困在这个问题上2天了。

我有一个如下所示的数据框：

['a','e']
['b','f']
['c','g']
['d','h']
['a','i']
['b','j']
['c','k']
['d','l']

我需要把它变成这样的

['a',['e','i']]
['b',['f','j']]
['c',['g','k']]
['d',['h','l']]

所以基本上围绕第一列旋转原始数据框，然后从第二列创建字符串列表。

感谢

Answer 1

您可以使用groupy/agg：

import pandas as pd

data = [['a','e'], ['b','f'], ['c','g'], ['d','h'], ['a','i'], ['b','j'], 
        ['c','k'], ['d','l']]

df = pd.DataFrame(data, columns=['first', 'second'])
print(df.groupby(['first']).agg(lambda x: x.tolist()))

产量

       second
first        
a      [e, i]
b      [f, j]
c      [g, k]
d      [h, l]

与python pandas进行数据争夺

1 个答案: