由于用引号引起的数据中存在空格,因此尝试用熊猫读取csv文件时遇到问题。
csv文件中的标题行是“序列号,名字,姓氏,国家”。
每行的示例数据为“ 1”,“ David,T”,“ Barnes”,“ USA”。
下面是到目前为止我尝试过的代码,试图删除引号并阅读2个引号内的文本。
import pandas as pd
import csv
df = pd.read_csv('file1.csv', sep=',', encoding='ansi', quotechar='"', quoting=csv.QUOTE_NONNUMERIC, doublequote=True, engine="python")
是否可以对文件进行预处理,以使结果如下所示?
Serial No, First Name, Last Name, Country
1, David,T, Barnes, USA
答案 0 :(得分:0)
尝试使用它。
file1 = pd.read_csv('sample.txt',sep=',\s+',skipinitialspace=True,quoting=csv.QUOTE_ALL,engine=python)
答案 1 :(得分:0)
在我使用Editpad替换逗号并删除引号的情况下将其关闭,以供解决。