如何按列分组并删除或分隔熊猫中的值?

时间:2019-02-04 13:46:06

标签: pandas pandas-groupby

我有一个三列的熊猫数据框。

我想按第3列对数据框进行分组,但它可以工作,但是我的问题是其他列的值显示。

对于第一行,值始终是相同的,但是我不想在输出中为该行两次显示相同的值,而是只显示一次,因此基本上删除了重复项。

对于第二行,我想用逗号分隔值。

分组依据工作正常,但我似乎无法找出如何更改其他两行的输出。

最适合分组的是

df_2 = df.groupby(['Postcode']).sum()

但是结果当然不会删除第1行中的重复值,也不会逗号分隔第2行中的值。

很抱歉,这个问题可能并不难,但到目前为止我还是无法解决。

1 个答案:

答案 0 :(得分:0)

我相信您需要DataFrameGroupBy.aggfirstjoin

df = df.groupby('col3').agg({'col1':'first', 'col2':','.join})