我有一个三列的熊猫数据框。
我想按第3列对数据框进行分组,但它可以工作,但是我的问题是其他列的值显示。
对于第一行,值始终是相同的,但是我不想在输出中为该行两次显示相同的值,而是只显示一次,因此基本上删除了重复项。
对于第二行,我想用逗号分隔值。
分组依据工作正常,但我似乎无法找出如何更改其他两行的输出。
最适合分组的是
df_2 = df.groupby(['Postcode']).sum()
但是结果当然不会删除第1行中的重复值,也不会逗号分隔第2行中的值。
很抱歉,这个问题可能并不难,但到目前为止我还是无法解决。
答案 0 :(得分:0)
我相信您需要DataFrameGroupBy.agg
和first
和join
:
df = df.groupby('col3').agg({'col1':'first', 'col2':','.join})