Pandas read_csv EOF在字符串中从行开始

时间:2017-12-29 13:02:26

标签: python pandas eof

我正面临着pandas read_csv的问题。我有一个文件,其中包含"作为字段值。实际上,情况应该不是这样,但我对文件生成没有影响,因此我必须找到解决方法。

  

pandas.errors.ParserError:标记数据时出错。 C错误:字符串中的EOF从第15345行开始

我在Git(link here)上发现了一个关于此的问题报告,他们建议使用用于" sep"的定界符。参数也适用于" quotechar"。在这种情况下,文件结构搞砸了。

我做的另一件事是为此添加一个例外,它将为其余文件运行代码,但我将继续针对该特定类型的文件提出该问题。

我用来读取CSV文件的命令:

df_new = pd.read_csv(file_path_name, sep=";", error_bad_lines=False)

对此有任何解决方法的想法(例如忽略此问题的行)?我猜想的一种方法是使用csv库删除该行(或用其他东西替换")但我想保持简单并尽可能地在熊猫中做。

Python版本:3.6.2

熊猫版:0.21.0

谢谢你,以及最好的问候

1 个答案:

答案 0 :(得分:0)

只想指出来自@ user8505495的建议有效(再次谢谢你)。

基本上只需将参数quoting=3添加到read_csv。在to_csv中使用相同的参数导致和错误(缺少转义字符)。一种选择是设置escapechar参数,或者不使用quoting参数。