我正在使用大型数据集,因此我不得不清理一些行,因此现在不遵循索引,因为缺少某些索引。现在我有:
%SystemRoot%\System32\cmd.exe
无论A列是什么意思,我都必须使用它,对其进行拆分和转换。因此,最后,我从该操作中得到了两个变量(A_case1,A_case2),其中:
A
2 2
5 4
7 5
8 6
17 6
21 8
但是现在我想合并这两个变量并加入原始数据框。所以我希望最终结果是:
print(A_case1)
2 4
7 2
17 3
21 2
print(A_case2)
5 2
8 1
我已经尝试过pd.concat,但是无法加入数据框。有人可以帮我吗?
答案 0 :(得分:0)
首先将新数据帧A_case1
和A_case2
合并到原始数据帧(df
)中:
merged = df.merge(A_case1, left_index=True, right_index=True, how='left').merge(A_case2, left_index=True, right_index=True, how='left')
然后通过联接两个中间的A_case1_case2
和A_case1
创建新列A_case2
:
merged['A_case1_case2'] = merged[['A_case1', 'A_case2']].apply(lambda x: ''.join(x.dropna().astype(int).astype(str)), 1)
最后删除中间列A_case1
和A_case2
:
merged = merged.drop(['A_case1', 'A_case2'], 1)