Question

我有以下数据框。

<头>

我正在尝试通过列表的串联，根据水果的描述进行分组。我应该得到：

<头>

我遵循了此处提供的解决方案：pandas groupby and join lists：

df = df.groupby('Fruit', as_index=False).agg(Description =('Description', 'sum'))

但我得到的是相互关联的列表：

<头>

有没有人有解决办法？谢谢！

Answer 1

那是因为您的 Description 列是字符串。您可以去掉 [] 并求和：

 '[' + df['Description'].str[1:-1].groupby(df['Fruit']).agg(', '.join) + ']'

Answer 2

为了保持您的列表格式，我建议您先运行一个命令：

import json
df['Description'] = df['Description'].apply(json.loads)
df = df.groupby('Fruit', as_index=False).agg(Description =('Description', 'sum'))

这样，您在 Description 列中的值将是实际列表，而不是字符串。