我有一个包含2列的数据框。在每一列中,每个元素都是一个numpy数组。我想添加第三列,即现有列中数组的串联。
说我的数据框是
[1,2,3] [4,5,6]
[1,1,1] [2,2,2]
[0,0,0] [1,1,1]
我希望新的数据框是
[1,2,3] [4,5,6] [1,2,3,4,5,6]
[1,1,1] [2,2,2] [1,1,1,2,2,2]
[0,0,0] [1,1,1] [0,0,0,1,1,1]
我的数据框非常大,因此效率在这里很重要。例如,遍历行并单独连接太慢。另一方面,类似:
df['C'] = list(np.concatenate([df.A.to_list(), df.B.to_list()], axis=1))
占用过多内存 (其中df是数据框,它的现有列称为A和B)