在pandas.read_csv

时间:2016-12-12 06:17:24

标签: python csv pandas double-quotes

当我读取包含双重量化的CSV文件时,CParserError出现。如何避免此错误并正确加载CSV文件?

请假设我无法编辑CSV文件,因为实际上有很多类似的文件需要加载。

my.csv

abc,",def

csv_loader.py

import pandas as pd
pd.read_csv("my.csv")

错误消息

  

CParserError:标记数据时出错。 C错误:从第0行开始的字符串中的EOF

1 个答案:

答案 0 :(得分:4)

解决方案是将quotechar设置为与分隔符相同,请参阅github issue 5500

import pandas as pd
from pandas.compat import StringIO

temp=u"""a,b,c
abc,",def
"""
#after testing replace StringIO(temp) to filename
df = pd.read_csv(StringIO(temp), quotechar=',')
print (df)

     a  b    c
0  abc  "  def