我有一个鱼类出现的csv文件,需要修剪掉只出现一次的鱼,然后将其输出为“修剪过的”csv。但是,我正在使用的函数为修剪后的csv添加了一个无头列,这会影响我需要对修剪文件进行的进一步计算。
该列包含来自to_keep
的行号,我相信是根据此行创建的:return df[df[colname].isin(to_keep)]
。我想让这个脚本不创建这个列;否则我没有从我修剪的每个csv文件中手动删除它!
import pandas as pd
def trim_single_entries(fn, colname):
# remove all entries where colname's entry is unique to one row across the whole file
df = pd.read_csv(fn)
if colname in df.columns:
counts = df[colname].value_counts()
to_keep = [counts.index[i] for i in range(0,len(counts)) if counts.values[i] > 1]
return df[df[colname].isin(to_keep)]
else:
return False
x = trim_single_entries('fish_data.csv', 'catalognumber')
x.to_csv('trimmed_fish_data.csv')
答案 0 :(得分:1)
将index=False
添加到to_csv
方法