如何在熊猫中串联包含列表(系列)的两列

时间:2018-08-16 06:19:45

标签: python python-2.7 pandas numpy concatenation

我想在熊猫中串联两列。每列均包含1x4元素的浮点列表。我想合并两列,以便输出是1x8的向量。下面显示了数据框的片段

ue,bs
"[1.27932459e-01 7.83234197e-02 3.24789420e-02 4.34971932e-01]","[2.97806183e-01 2.32453145e-01 3.10236304e-01 1.69975788e-02]"
"[0.05627587 0.4113416  0.02160842 0.20420576]","[1.64862491e-01 1.35556330e-01 2.59050065e-02 1.42498115e-02]"

要连接两列,请执行以下操作:

df['ue_bs'] = zip(df_join['ue'], df_join['bs'])

有了这个,我得到一个新列'ue_bs',其中包含df['ue_bs']第一行的内容:

(array([1.27932459e-01, 7.83234197e-02, 3.24789420e-02, 4.34971932e-01]),
 array([2.97806183e-01, 2.32453145e-01, 3.10236304e-01, 1.69975788e-02]))

但是,它们仍然是两个数组。为了合并它们,我这样做如下:

a = df['ue_bs'][0]
np.concatenate((a[0], a[1]), axis=0)

然后,我得到

array([1.27932459e-01, 7.83234197e-02, 3.24789420e-02, 4.34971932e-01,
   2.97806183e-01, 2.32453145e-01, 3.10236304e-01, 1.69975788e-02])

我想知道是否有一种简洁的方法可以在单行代码中完成此操作,而不必循环遍历df['ue_bs']并执行np.concatenate()

2 个答案:

答案 0 :(得分:3)

要在python中合并两个列表,最简单的方法是使用+。在pandas中压缩列时也是如此。您可以简单地做到:

df['ue_bs'] = df['ue'] + df['bs']

如果列类型是numpy数组,则可以先将它们转换为普通的python列表,然后再进行补充:

df['ue_bs'] = df['ue'].apply(lambda x: x.tolist()) + df['bs'].apply(lambda x: x.tolist())

答案 1 :(得分:2)

创建2d numpy数组,然后创建numpy.hstack

a = np.array(df[['ue','bs']].values.tolist())
df['ue_bs'] = np.hstack((a[:, 0], a[:, 1])).tolist()

print (df.loc[0, 'ue_bs'])
[0.127932459, 0.0783234197, 0.032478942, 0.434971932, 
 0.297806183, 0.232453145, 0.310236304, 0.0169975788]