我的第一个数据集是tsv格式
<link href="css/bootstrap.min.css" rel="stylesheet">
<link href="css/custom.css" rel="stylesheet">
<script src="js/jquery.min.js"></script>
<script src="js/bootstrap.min.js"></script>
<script src="js/register.js"></script>
<script src="js/login.js"></script>
表格中的第二个数据集
Id Val1 Val2
0 1 2
1 2 3
2 3 5
3 1 3
我必须在Column Id上加入两个数据集,以便将输出作为
Id Val3
0 3
2 5
我如何在熊猫中实现这一目标?
答案 0 :(得分:1)
查看df.merge
您可能想要设置df.merge(df2, on='Id', how='inner')
答案 1 :(得分:0)
在pandas中你使用MERGE函数加入。
使用您的初始数据框:
df1 = pd.DataFrame({"Id": [0,1,2,3], "Val1": [1,2,3,1], "Val2": [2,3,5,3]})
df2 = pd.DataFrame({"Id": [0,2], "Val3": [3,5]})
使用pd.merge()进行内连接:
df = pd.merge(left=df1, right=df2, how='inner')
df
Id Val1 Val2 Val3
0 1 2 3
2 3 5 5