我有一个有三列的df。对于其中两列,某些行包含逗号,如下所示:
In [40]: df_given=pd.DataFrame([['bla', 'A,B', '1,2'],['bla','C,D','45,34'],['bla','A','3']])
In [41]: df_given
Out[41]:
0 1 2
0 bla A,B 1,2
1 bla C,D 45,34
2 bla A 3
对于带逗号的行,我希望有两行,其值可以在逗号前面或后面:
In [42]: df_wanted=pd.DataFrame([['bla', 'A', '1'],['bla', 'B', '2'],['bla','C','45'],['bla','D','34'],['bla','A','3']])
In [43]: df_wanted
Out[43]:
0 1 2
0 bla A 1
1 bla B 2
2 bla C 45
3 bla D 34
4 bla A 3
我考虑过将逗号行复制到lstrip或rstrip它们。但我不知道如何区分这两个副本。有没有人有想法?
我不确定我的方法是否是最好的方法。由于我的文件很大,我会很感激消耗内存的解决方案。