Python Pandas-从csv文件中读取数据行和带引号的非文本

时间:2019-09-03 03:18:05

标签: python pandas csv

由于用引号引起的数据中存在空格,因此尝试用熊猫读取csv文件时遇到问题。

csv文件中的标题行是“序列号,名字,姓氏,国家”。

每行的示例数据为“ 1”,“ David,T”,“ Barnes”,“ USA”。

下面是到目前为止我尝试过的代码,试图删除引号并阅读2个引号内的文本。

import pandas as pd
import csv

df = pd.read_csv('file1.csv', sep=',', encoding='ansi', quotechar='"', quoting=csv.QUOTE_NONNUMERIC, doublequote=True, engine="python")

是否可以对文件进行预处理,以使结果如下所示?

Serial No, First Name, Last Name, Country

1, David,T, Barnes, USA

2 个答案:

答案 0 :(得分:0)

尝试使用它。

file1 = pd.read_csv('sample.txt',sep=',\s+',skipinitialspace=True,quoting=csv.QUOTE_ALL,engine=python)

答案 1 :(得分:0)

在我使用Editpad替换逗号并删除引号的情况下将其关闭,以供解决。