我有两个数据框:
df1是我的temapte框架
DF1
indx name
1 alex
2 jony
3 roy
4 sali
df2是我的原始数据框,我需要将df2与df1进行比较,并将df2中的新条目(模板中不存在df1)附加到df1,以便更新我的模板数据框。
如何使用pandas python进行比较并在数据框中追加新值
DF2
indx name
1 sali
2 george
3 roy
4 alex
5 john
6 bennet
结果数据框df3
indx name
1 alex
2 jony
3 roy
4 sali
5 george
6 john
7 bennet
提前感谢。
答案 0 :(得分:1)
如果条目顺序不重要:
In [33]: pd.DataFrame({'name':np.union1d(d1.name, d2.name)})
Out[33]:
name
0 alex
1 bennet
2 george
3 john
4 jony
5 roy
6 sali
答案 1 :(得分:1)
使用pd.concat
和df.drop_duplicates
:
out = pd.concat([df1.name, df2.name]).drop_duplicates().reset_index(drop=1).to_frame()
print(out)
name
0 alex
1 jony
2 roy
3 sali
4 george
5 john
6 bennet