我有一个如下所示的数据框:
DF1 =
ID A B C D E F
1 x x x x x x
2 x x x x x x
3 x x x x x x
另一个看起来像的数据框:
DF2 =
ID A B C D G H
1 x x x x x x
2 x x x x x x
3 x x x x x x
如何有效地加入他们以便我拥有:
DF_Result =
ID A B C D E F G H
1 x x x x x x x x
2 x x x x x x x x
3 x x x x x x x x
第一个cloumns(A,B,C,D)在两个数据帧中都很常见。
这应该很简单,但我在pandas的连接选项中丢失了。对此有何建议?
答案 0 :(得分:0)
您正在寻找Pandas merge
:
result = pd.merge(DF1, DF2, on='A')
注意这个警告:
在重复键上加入/合并可能会导致返回的帧 行维度的乘法可能会导致内存 溢出。管理重复值是用户的责任 在加入大型DataFrame之前在键中。
加入重复项的方法也在how
关键字:
pd.merge(DF1, DF2, on='A', how='outer')
您可以使用indicator
关键字选择合并是仅采用"left"
,"right"
还是"both"
。