Question

我想在熊猫中串联两列。每列均包含1x4元素的浮点列表。我想合并两列，以便输出是1x8的向量。下面显示了数据框的片段

ue,bs
"[1.27932459e-01 7.83234197e-02 3.24789420e-02 4.34971932e-01]","[2.97806183e-01 2.32453145e-01 3.10236304e-01 1.69975788e-02]"
"[0.05627587 0.4113416  0.02160842 0.20420576]","[1.64862491e-01 1.35556330e-01 2.59050065e-02 1.42498115e-02]"

要连接两列，请执行以下操作：

df['ue_bs'] = zip(df_join['ue'], df_join['bs'])

有了这个，我得到一个新列'ue_bs'，其中包含df['ue_bs']第一行的内容：

(array([1.27932459e-01, 7.83234197e-02, 3.24789420e-02, 4.34971932e-01]),
 array([2.97806183e-01, 2.32453145e-01, 3.10236304e-01, 1.69975788e-02]))

但是，它们仍然是两个数组。为了合并它们，我这样做如下：

a = df['ue_bs'][0]
np.concatenate((a[0], a[1]), axis=0)

然后，我得到

array([1.27932459e-01, 7.83234197e-02, 3.24789420e-02, 4.34971932e-01,
   2.97806183e-01, 2.32453145e-01, 3.10236304e-01, 1.69975788e-02])

我想知道是否有一种简洁的方法可以在单行代码中完成此操作，而不必循环遍历df['ue_bs']并执行np.concatenate()？

Answer 1

要在python中合并两个列表，最简单的方法是使用+。在pandas中压缩列时也是如此。您可以简单地做到：

df['ue_bs'] = df['ue'] + df['bs']

如果列类型是numpy数组，则可以先将它们转换为普通的python列表，然后再进行补充：

df['ue_bs'] = df['ue'].apply(lambda x: x.tolist()) + df['bs'].apply(lambda x: x.tolist())

Answer 2

创建2d numpy数组，然后创建numpy.hstack：

a = np.array(df[['ue','bs']].values.tolist())
df['ue_bs'] = np.hstack((a[:, 0], a[:, 1])).tolist()

print (df.loc[0, 'ue_bs'])
[0.127932459, 0.0783234197, 0.032478942, 0.434971932, 
 0.297806183, 0.232453145, 0.310236304, 0.0169975788]

如何在熊猫中串联包含列表（系列）的两列

2 个答案: