Question

我正面临着pandas read_csv的问题。我有一个文件，其中包含＆＃34;作为字段值。实际上，情况应该不是这样，但我对文件生成没有影响，因此我必须找到解决方法。

pandas.errors.ParserError：标记数据时出错。 C错误：字符串中的EOF从第15345行开始

我在Git（link here）上发现了一个关于此的问题报告，他们建议使用用于＆＃34; sep＆＃34;的定界符。参数也适用于＆＃34; quotechar＆＃34;。在这种情况下，文件结构搞砸了。

我做的另一件事是为此添加一个例外，它将为其余文件运行代码，但我将继续针对该特定类型的文件提出该问题。

我用来读取CSV文件的命令：

df_new = pd.read_csv(file_path_name, sep=";", error_bad_lines=False)

对此有任何解决方法的想法（例如忽略此问题的行）？我猜想的一种方法是使用csv库删除该行（或用其他东西替换＆＃34;）但我想保持简单并尽可能地在熊猫中做。

Python版本：3.6.2

熊猫版：0.21.0

谢谢你，以及最好的问候

Answer 1

只想指出来自@ user8505495的建议有效（再次谢谢你）。

基本上只需将参数quoting=3添加到read_csv。在to_csv中使用相同的参数导致和错误（缺少转义字符）。一种选择是设置escapechar参数，或者不使用quoting参数。