我有一个csv,其条目如下:
"432983278.2","3764",""The CITY TOW" of San Francisco, CA","",""...
,即该条目中有一个逗号和一对引号,应将其引为"THE CITY TOW" of San Francisco, CA
我没有重新生成此csv的选项
我尝试了pandas.read_csv("thefile.csv",quoting=csv.QUOTE_ALL, quotechar = '"')
以及一些不同的编码和引号选项,但是仍然无法解决。
答案 0 :(得分:0)
您可以尝试一下,
import pandas as pd
df = pd.read_csv(file_path,
sep=', (?=(?:"[^"]*?(?: [^"]*)*))|, (?=[^",]+(?:,|$))',
engine='python')
答案 1 :(得分:0)
如果只有几行,您可以忽略这些行吗?
import pandas as pd
pd.read_csv("thefile.csv", error_bad_lines=False)
答案 2 :(得分:0)
问题是不必要的双引号。但是,如果您查看模式,(","
)似乎是一个分隔符,可以为您提供所需的内容。
由于数据的所有列都是字符串,因此可以使用dtype=str
和sep='","'
将CSV导入到熊猫数据框
"432983278.2","3764",""The CITY TOW" of San Francisco, CA","",""...
尝试使用:
df = pd.read_csv('file.csv', sep='","', dtype=str)