让pandas数据框df
至少包含C1,C2,C3列,您如何将所有唯一的C1,C2,C3值作为新的DataFrame?
SELECT C1,C2,C3
FROM T
GROUP BY C1,C2,C3
试过那个
print df.groupby(by=['C1','C2','C3'])
但即将到来
<pandas.core.groupby.DataFrameGroupBy object at 0x000000000769A9E8>
答案 0 :(得分:11)
如果想要所有独特的三元组,我相信你需要drop_duplicates
:
df = df.drop_duplicates(subset=['C1','C2','C3'])
如果要使用groupby
添加first
:
df = df.groupby(by=['C1','C2','C3'], as_index=False).first()