Question

我正在尝试将包含文本信息的文件保存为csv格式。但是，在熊猫中使用“ to_csv”（不指定任何内容）后，保存文件，然后使用pd.read_csv重新打开文件。它会给我这个错误信息：

ParserError: Error tokenizing data. C error: Buffer overflow caught - possible malformed input file.

但是，如果我以pd.read_csv（'file.csv'，lineterminator ='\ n'）之类的大熊猫读取了csv文件。它将正确打开文件。

但是，我需要使用软件来处理这些文本文件，并且该软件打开文件的方式与Excel打开CSV文件的方式相同，并且我无法像在python中那样指定lineterminator ='\ n' 。如果使用该软件打开csv文件，则该列中的某些文本将转到其他行。索引378和379之间的文本应该放在378行中。但是，它们转到其他行并转到索引列。

           id               text
378         1    Good morning. This row's text goes to the following rows
Dot dot    NaN              NaN
HELLO      NaN              NaN
Apple      NaN              NaN
379         2    This row is correct

当我使用pandas.to_csv保存数据框时，有人知道如何解决此问题吗？如果要在Excel之类的软件中正确打开文件，我应该指定什么？

Answer 1

尝试一下：

df = pd.read_csv('file.csv', error_bad_lines=False)

Answer 2

感谢您的答复。我发现了问题。它是文本中的“ \ r”。我删除了文本中的所有“ \ r”，现在可以正常工作了。谢谢1

大熊猫使用lineterminator ='\ n'保存到csv

2 个答案: