我使用pandas python库创建了一个脚本来合并几个.csv文件。所有文件都使用" \ n \ r"作为记录分隔符。
我遇到了一个文件的问题,在特定领域,有时" \ n"发生。这导致pandas.read_csv
将其计为新行。
是否有机会(除了字段分隔符)指定记录分隔符?或者会有更好的解决方案吗?
谢谢你,以及最好的问候
答案 0 :(得分:0)
有lineterminator
kwarg:
lineterminator : str (length 1), default None
Character to break file into lines. Only valid with C parser.
请注意,它需要使用C语法分析器(请参阅engine
kwarg)
鉴于您的行以\r
结尾,carriage return character我会建议将其用作lineterminator
并进行后期处理以清理\n
& #39; s留下了。
我认为设置lineterminator='\r'
可以解决您的问题。