我继承了一个csv,该csv似乎将一个数据框另存为一个较大数据框中的行条目。因此,您在csv中有一个类似于以下内容的行条目:
Total Length Days Average Length Between Visits StartDate \
0 53 53.000000 2018-03-29 09:35:00
1 77 15.400000 2018-05-15 08:44:00
2 139 23.166667 2018-08-14 13:36:00
EndDate All Visits Within 90 days
0 2018-05-21 13:15:00 true
1 2018-07-31 14:39:00 true
2 2018-12-31 16:30:00 true
这是另一行供参考:
" Total Length Days Average Length Between Visits StartDate \
0 335 167.5 2013-11-21 07:34:00
EndDate All Visits Within 90 days
0 2014-10-22 07:38:46 false "
在将此csv加载为数据帧时,该条目显示为字符串。我尝试使用以下代码将此字符串转换为DataFrame(这是重复问题的答案):
pd.read_csv(StringIO(stringToConvert), sep='\\\s+')
但是,这给了我一个数据框,其中缺少数据,并且列未对齐(像这样)(仅第一行):
Total 0
Length 53
Days 53.000000
Average 2018-03-29
Length.1 09:35:00
Between NaN
Visits NaN
StartDate NaN
\ NaN
关于如何正确将此字符串转换为数据框的任何想法?我认为问题与长列名/大数据有关,这会导致某些换行符无法再次读取。