使用简单的数据框df:
ID | other columns
123
123
343
345
234
234
我想将第一列保存到csv但是要删除。
df['ID'].to_csv('file.csv')
如何在保存之前重复删除?谢谢
答案 0 :(得分:4)
如果ID
是列,则需要DataFrame.drop_duplicates
:
df.drop_duplicates(subset=['ID']).to_csv('file.csv')
如果ID
需要索引Index.duplicated
:
df = df[~df.index.duplicated()].to_csv('file.csv')
答案 1 :(得分:3)
您可以使用unique elements
或drop_duplicates
获取ID的唯一列表
df['ID'].unique().to_csv('file.csv')