Question

我使用pandas python库创建了一个脚本来合并几个.csv文件。所有文件都使用＆＃34; \ n \ r＆＃34;作为记录分隔符。我遇到了一个文件的问题，在特定领域，有时＆＃34; \ n＆＃34;发生。这导致pandas.read_csv将其计为新行。

是否有机会（除了字段分隔符）指定记录分隔符？或者会有更好的解决方案吗？

谢谢你，以及最好的问候

Answer 1

中的所有kwargs

有lineterminator kwarg：

lineterminator : str (length 1), default None
    Character to break file into lines. Only valid with C parser.

请注意，它需要使用C语法分析器（请参阅engine kwarg）

鉴于您的行以\r结尾，carriage return character我会建议将其用作lineterminator并进行后期处理以清理\n＆＃39; s留下了。

我认为设置lineterminator='\r'可以解决您的问题。