所以我正在读取CSV文件,然后只保留某些列并重写文件。我遇到的问题是一列(比如ColumnA)在双引号中有它的值。我有一个简单的方法来完成这项任务并删除那些双引号吗?
a = pd.read_csv(filename,low_memory=False)
a1 = a[['ColumnA','ColumnB']]
a1.to_csv('filelocation')
答案 0 :(得分:1)
您可以使用csv.QUOTE_NONE
禁止引用:
import csv
pd.read_csv(filename,usecols=['ColumnA','ColumnB']) \
.to_csv(new_file_name, quoting=csv.QUOTE_NONE, index=False)
但选择另一个分隔符(ColumnA
列中未出现的分隔符)会更好(更安全),因此将来读取/解析新CSV文件时不会出现问题:
pd.read_csv(filename,usecols=['ColumnA','ColumnB']) \
.to_csv(new_file_name, sep=';', index=False)