当我读取包含双重量化的CSV文件时,CParserError
出现。如何避免此错误并正确加载CSV文件?
请假设我无法编辑CSV文件,因为实际上有很多类似的文件需要加载。
my.csv
abc,",def
csv_loader.py
import pandas as pd
pd.read_csv("my.csv")
错误消息
CParserError:标记数据时出错。 C错误:从第0行开始的字符串中的EOF
答案 0 :(得分:4)
解决方案是将quotechar
设置为与分隔符相同,请参阅github issue 5500:
import pandas as pd
from pandas.compat import StringIO
temp=u"""a,b,c
abc,",def
"""
#after testing replace StringIO(temp) to filename
df = pd.read_csv(StringIO(temp), quotechar=',')
print (df)
a b c
0 abc " def