我想在熊猫中串联两列。每列均包含1x4元素的浮点列表。我想合并两列,以便输出是1x8的向量。下面显示了数据框的片段
ue,bs
"[1.27932459e-01 7.83234197e-02 3.24789420e-02 4.34971932e-01]","[2.97806183e-01 2.32453145e-01 3.10236304e-01 1.69975788e-02]"
"[0.05627587 0.4113416 0.02160842 0.20420576]","[1.64862491e-01 1.35556330e-01 2.59050065e-02 1.42498115e-02]"
要连接两列,请执行以下操作:
df['ue_bs'] = zip(df_join['ue'], df_join['bs'])
有了这个,我得到一个新列'ue_bs',其中包含df['ue_bs']
第一行的内容:
(array([1.27932459e-01, 7.83234197e-02, 3.24789420e-02, 4.34971932e-01]),
array([2.97806183e-01, 2.32453145e-01, 3.10236304e-01, 1.69975788e-02]))
但是,它们仍然是两个数组。为了合并它们,我这样做如下:
a = df['ue_bs'][0]
np.concatenate((a[0], a[1]), axis=0)
然后,我得到
array([1.27932459e-01, 7.83234197e-02, 3.24789420e-02, 4.34971932e-01,
2.97806183e-01, 2.32453145e-01, 3.10236304e-01, 1.69975788e-02])
我想知道是否有一种简洁的方法可以在单行代码中完成此操作,而不必循环遍历df['ue_bs']
并执行np.concatenate()
?
答案 0 :(得分:3)
要在python中合并两个列表,最简单的方法是使用+
。在pandas中压缩列时也是如此。您可以简单地做到:
df['ue_bs'] = df['ue'] + df['bs']
如果列类型是numpy数组,则可以先将它们转换为普通的python列表,然后再进行补充:
df['ue_bs'] = df['ue'].apply(lambda x: x.tolist()) + df['bs'].apply(lambda x: x.tolist())
答案 1 :(得分:2)
创建2d numpy数组,然后创建numpy.hstack
:
a = np.array(df[['ue','bs']].values.tolist())
df['ue_bs'] = np.hstack((a[:, 0], a[:, 1])).tolist()
print (df.loc[0, 'ue_bs'])
[0.127932459, 0.0783234197, 0.032478942, 0.434971932,
0.297806183, 0.232453145, 0.310236304, 0.0169975788]