我正在尝试将包含文本信息的文件保存为csv格式。 但是,在熊猫中使用“ to_csv”(不指定任何内容)后,保存文件,然后使用pd.read_csv重新打开文件。它会给我这个错误信息:
ParserError: Error tokenizing data. C error: Buffer overflow caught - possible malformed input file.
但是,如果我以pd.read_csv('file.csv',lineterminator ='\ n')之类的大熊猫读取了csv文件。它将正确打开文件。
但是,我需要使用软件来处理这些文本文件,并且该软件打开文件的方式与Excel打开CSV文件的方式相同,并且我无法像在python中那样指定lineterminator ='\ n' 。如果使用该软件打开csv文件,则该列中的某些文本将转到其他行。 索引378和379之间的文本应该放在378行中。但是,它们转到其他行并转到索引列。
id text
378 1 Good morning. This row's text goes to the following rows
Dot dot NaN NaN
HELLO NaN NaN
Apple NaN NaN
379 2 This row is correct
当我使用pandas.to_csv保存数据框时,有人知道如何解决此问题吗?如果要在Excel之类的软件中正确打开文件,我应该指定什么?
答案 0 :(得分:0)
尝试一下:
df = pd.read_csv('file.csv', error_bad_lines=False)
答案 1 :(得分:0)
感谢您的答复。我发现了问题。它是文本中的“ \ r”。我删除了文本中的所有“ \ r”,现在可以正常工作了。谢谢1