在Python Pandas

时间:2017-12-13 14:02:51

标签: python pandas csv delimiter

我使用pandas python库创建了一个脚本来合并几个.csv文件。所有文件都使用" \ n \ r"作为记录分隔符。 我遇到了一个文件的问题,在特定领域,有时" \ n"发生。这导致pandas.read_csv将其计为新行。

是否有机会(除了字段分隔符)指定记录分隔符?或者会有更好的解决方案吗?

谢谢你,以及最好的问候

1 个答案:

答案 0 :(得分:0)

查看pandas.read_csv

中的所有kwargs

lineterminator kwarg:

lineterminator : str (length 1), default None
    Character to break file into lines. Only valid with C parser.

请注意,它需要使用C语法分析器(请参阅engine kwarg)

鉴于您的行以\r结尾,carriage return character我会建议将其用作lineterminator并进行后期处理以清理\n& #39; s留下了。

我认为设置lineterminator='\r'可以解决您的问题。