大熊猫使用lineterminator ='\ n'保存到csv

时间:2020-09-12 11:40:05

标签: python pandas csv

我正在尝试将包含文本信息的文件保存为csv格式。 但是,在熊猫中使用“ to_csv”(不指定任何内容)后,保存文件,然后使用pd.read_csv重新打开文件。它会给我这个错误信息:

ParserError: Error tokenizing data. C error: Buffer overflow caught - possible malformed input file.

但是,如果我以pd.read_csv('file.csv',lineterminator ='\ n')之类的大熊猫读取了csv文件。它将正确打开文件。

但是,我需要使用软件来处理这些文本文件,并且该软件打开文件的方式与Excel打开CSV文件的方式相同,并且我无法像在python中那样指定lineterminator ='\ n' 。如果使用该软件打开csv文件,则该列中的某些文本将转到其他行。 索引378和379之间的文本应该放在378行中。但是,它们转到其他行并转到索引列。

           id               text
378         1    Good morning. This row's text goes to the following rows
Dot dot    NaN              NaN
HELLO      NaN              NaN
Apple      NaN              NaN
379         2    This row is correct

当我使用pandas.to_csv保存数据框时,有人知道如何解决此问题吗?如果要在Excel之类的软件中正确打开文件,我应该指定什么?

2 个答案:

答案 0 :(得分:0)

尝试一下:

df = pd.read_csv('file.csv', error_bad_lines=False)

答案 1 :(得分:0)

感谢您的答复。我发现了问题。它是文本中的“ \ r”。我删除了文本中的所有“ \ r”,现在可以正常工作了。谢谢1