python df:基于str将列拆分为行但保留其他数据

时间:2018-02-26 15:52:25

标签: python pandas

我有一个有三列的df。对于其中两列,某些行包含逗号,如下所示:

In [40]: df_given=pd.DataFrame([['bla', 'A,B', '1,2'],['bla','C,D','45,34'],['bla','A','3']])

In [41]: df_given
Out[41]:
     0    1      2
0  bla  A,B    1,2
1  bla  C,D  45,34
2  bla    A      3

对于带逗号的行,我希望有两行,其值可以在逗号前面或后面:

In [42]: df_wanted=pd.DataFrame([['bla', 'A', '1'],['bla', 'B', '2'],['bla','C','45'],['bla','D','34'],['bla','A','3']])

In [43]: df_wanted
Out[43]:
     0  1   2
0  bla  A   1
1  bla  B   2
2  bla  C  45
3  bla  D  34
4  bla  A   3

我考虑过将逗号行复制到lstrip或rstrip它们。但我不知道如何区分这两个副本。有没有人有想法?

我不确定我的方法是否是最好的方法。由于我的文件很大,我会很感激消耗内存的解决方案。

0 个答案:

没有答案