我正面临着pandas read_csv的问题。我有一个文件,其中包含"作为字段值。实际上,情况应该不是这样,但我对文件生成没有影响,因此我必须找到解决方法。
pandas.errors.ParserError:标记数据时出错。 C错误:字符串中的EOF从第15345行开始
我在Git(link here)上发现了一个关于此的问题报告,他们建议使用用于" sep"的定界符。参数也适用于" quotechar"。在这种情况下,文件结构搞砸了。
我做的另一件事是为此添加一个例外,它将为其余文件运行代码,但我将继续针对该特定类型的文件提出该问题。
我用来读取CSV文件的命令:
df_new = pd.read_csv(file_path_name, sep=";", error_bad_lines=False)
对此有任何解决方法的想法(例如忽略此问题的行)?我猜想的一种方法是使用csv库删除该行(或用其他东西替换")但我想保持简单并尽可能地在熊猫中做。
Python版本:3.6.2
熊猫版:0.21.0
谢谢你,以及最好的问候
答案 0 :(得分:0)
只想指出来自@ user8505495的建议有效(再次谢谢你)。
基本上只需将参数quoting=3
添加到read_csv
。在to_csv
中使用相同的参数导致和错误(缺少转义字符)。一种选择是设置escapechar
参数,或者不使用quoting
参数。