熊猫:将不等长度的列表拆分成多列

时间:2017-06-20 22:18:56

标签: python pandas

我有一个如下所示的Pandas数据框:

v3.5

我试图将Whitespace control中的列表拆分成列,如下所示:

                   codes
1                  [71020]
2                  [77085]
3                  [36415]
4                  [99213, 99287]
5                  [99233, 99233, 99233]

其中没有值的列(因为列表不长)会填充空格或NaN或其他内容。

我已经看到像this one这样的答案和其他类似的答案,虽然它们在相同长度的列表上工作,但当我尝试在不等长度的列表上使用这些方法时,它们都会抛出错误。对此有好的方法吗?

2 个答案:

答案 0 :(得分:16)

尝试:

pd.DataFrame(df.codes.values.tolist()).add_prefix('code_')

   code_0   code_1   code_2
0   71020      NaN      NaN
1   77085      NaN      NaN
2   36415      NaN      NaN
3   99213  99287.0      NaN
4   99233  99233.0  99233.0

加入index

pd.DataFrame(df.codes.values.tolist(), df.index).add_prefix('code_')

   code_0   code_1   code_2
1   71020      NaN      NaN
2   77085      NaN      NaN
3   36415      NaN      NaN
4   99213  99287.0      NaN
5   99233  99233.0  99233.0

我们可以用这个来确定所有格式:

f = lambda x: 'code_{}'.format(x + 1)
pd.DataFrame(
    df.codes.values.tolist(),
    df.index, dtype=object
).fillna('').rename(columns=f)

   code_1 code_2 code_3
1   71020              
2   77085              
3   36415              
4   99213  99287       
5   99233  99233  99233

答案 1 :(得分:7)

另一种解决方案:

In [95]: df.codes.apply(pd.Series).add_prefix('code_')
Out[95]:
    code_0   code_1   code_2
1  71020.0      NaN      NaN
2  77085.0      NaN      NaN
3  36415.0      NaN      NaN
4  99213.0  99287.0      NaN
5  99233.0  99233.0  99233.0