有效地整理或连接两个pandas数据帧

时间:2017-06-23 14:42:00

标签: python pandas join merge

我有一个如下所示的数据框:

DF1 =
ID A  B C D E F
1  x  x x x x x
2  x  x x x x x
3  x  x x x x x

另一个看起来像的数据框:

DF2 =
ID A  B C D G H
1  x  x x x x x
2  x  x x x x x
3  x  x x x x x

如何有效地加入他们以便我拥有:

DF_Result =
ID A  B C D E F G H
1  x  x x x x x x x
2  x  x x x x x x x
3  x  x x x x x x x

第一个cloumns(A,B,C,D)在两个数据帧中都很常见。

这应该很简单,但我在pandas的连接选项中丢失了。对此有何建议?

1 个答案:

答案 0 :(得分:0)

您正在寻找Pandas merge

result = pd.merge(DF1, DF2, on='A')

注意这个警告:

  

在重复键上加入/合并可能会导致返回的帧   行维度的乘法可能会导致内存   溢出。管理重复值是用户的责任   在加入大型DataFrame之前在键中。

加入重复项的方法也在how关键字:

pd.merge(DF1, DF2, on='A', how='outer')

您可以使用indicator关键字选择合并是仅采用"left""right"还是"both"