熊猫数据框保存到csv时将嵌套数据框存储为字符串,如何转换回数据框

时间:2019-07-09 01:21:59

标签: python pandas csv dataframe

我继承了一个csv,该csv似乎将一个数据框另存为一个较大数据框中的行条目。因此,您在csv中有一个类似于以下内容的行条目:

   Total Length Days  Average Length Between Visits           StartDate  \
0                 53                      53.000000 2018-03-29 09:35:00   
1                 77                      15.400000 2018-05-15 08:44:00   
2                139                      23.166667 2018-08-14 13:36:00   

              EndDate All Visits Within 90 days  
0 2018-05-21 13:15:00                      true  
1 2018-07-31 14:39:00                      true  
2 2018-12-31 16:30:00                      true  

这是另一行供参考:

"   Total Length Days  Average Length Between Visits           StartDate  \
0                335                          167.5 2013-11-21 07:34:00   

              EndDate All Visits Within 90 days  
0 2014-10-22 07:38:46                     false  "

在将此csv加载为数据帧时,该条目显示为字符串。我尝试使用以下代码将此字符串转换为DataFrame(这是重复问题的答案):

pd.read_csv(StringIO(stringToConvert), sep='\\\s+')

但是,这给了我一个数据框,其中缺少数据,并且列未对齐(像这样)(仅第一行):

Total                 0
Length               53
Days          53.000000
Average      2018-03-29
Length.1       09:35:00
Between             NaN
Visits              NaN
StartDate           NaN
\                   NaN

关于如何正确将此字符串转换为数据框的任何想法?我认为问题与长列名/大数据有关,这会导致某些换行符无法再次读取。

0 个答案:

没有答案