加入Pandas类似于SQL Inner Join

时间:2017-01-05 15:44:17

标签: python pandas join

我的第一个数据集是tsv格式

<link href="css/bootstrap.min.css" rel="stylesheet">
<link href="css/custom.css" rel="stylesheet">
<script src="js/jquery.min.js"></script>
<script src="js/bootstrap.min.js"></script>
<script src="js/register.js"></script>
<script src="js/login.js"></script>

表格中的第二个数据集

Id  Val1    Val2
0   1   2
1   2   3
2   3   5
3   1   3

我必须在Column Id上加入两个数据集,以便将输出作为

Id  Val3
0   3
2   5

我如何在熊猫中实现这一目标?

2 个答案:

答案 0 :(得分:1)

查看df.merge

您可能想要设置df.merge(df2, on='Id', how='inner')

答案 1 :(得分:0)

在pandas中你使用MERGE函数加入。

使用您的初始数据框:

df1 = pd.DataFrame({"Id": [0,1,2,3], "Val1": [1,2,3,1], "Val2": [2,3,5,3]})
df2 = pd.DataFrame({"Id": [0,2], "Val3": [3,5]})

使用pd.merge()进行内连接:

df = pd.merge(left=df1, right=df2, how='inner')

df
Id  Val1    Val2    Val3
0   1   2   3
2   3   5   5