Question

我有一个三列的熊猫数据框。

我想按第3列对数据框进行分组，但它可以工作，但是我的问题是其他列的值显示。

对于第一行，值始终是相同的，但是我不想在输出中为该行两次显示相同的值，而是只显示一次，因此基本上删除了重复项。

对于第二行，我想用逗号分隔值。

分组依据工作正常，但我似乎无法找出如何更改其他两行的输出。

最适合分组的是

df_2 = df.groupby(['Postcode']).sum()

但是结果当然不会删除第1行中的重复值，也不会逗号分隔第2行中的值。

很抱歉，这个问题可能并不难，但到目前为止我还是无法解决。

Answer 1

我相信您需要DataFrameGroupBy.agg和first和join：

df = df.groupby('col3').agg({'col1':'first', 'col2':','.join})