熊猫使用csv中的值将“”和“,”导入csvs

时间:2018-12-04 19:54:57

标签: python python-3.x pandas csv

我有一个csv,其条目如下:

"432983278.2","3764",""The CITY TOW" of San Francisco, CA","",""...

,即该条目中有一个逗号和一对引号,应将其引为"THE CITY TOW" of San Francisco, CA 我没有重新生成此csv的选项

我尝试了pandas.read_csv("thefile.csv",quoting=csv.QUOTE_ALL, quotechar = '"')以及一些不同的编码和引号选项,但是仍然无法解决。

3 个答案:

答案 0 :(得分:0)

您可以尝试一下,

import pandas as pd

df = pd.read_csv(file_path, 
                 sep=', (?=(?:"[^"]*?(?: [^"]*)*))|, (?=[^",]+(?:,|$))',
                 engine='python')

答案 1 :(得分:0)

如果只有几行,您可以忽略这些行吗?

import pandas as pd
pd.read_csv("thefile.csv", error_bad_lines=False)

答案 2 :(得分:0)

问题是不必要的双引号。但是,如果您查看模式,(",")似乎是一个分隔符,可以为您提供所需的内容。

由于数据的所有列都是字符串,因此可以使用dtype=strsep='","'将CSV导入到熊猫数据框

"432983278.2","3764",""The CITY TOW" of San Francisco, CA","",""...

尝试使用:

df = pd.read_csv('file.csv', sep='","', dtype=str)