我有2个数据集。下面是2个数据集的示例表示(实际数据集有大约9000行数据)。
Ds01=pd.dataframe({
‘name’:[‘James', 'Henry', 'Abe', 'Brian', 'Claude']
‘ID’:[1001, 1234,#N/A,#N/A,#N/A]
‘Amount’:[10000, 15000, 350000, 45000000, 400]
})
Ds02=pd.dataframe({
Name:[john,James,321account,’Briane’,’Klaud’]
ID:[12,3467,854345,76457,976234]
})
我想在Ds01中填写Ds01中的#N / A作为ID列。 在python中有没有办法进行“软匹配”?我在熊猫中使用过合并。但除非名称完全匹配,否则不匹配。还有其他我可以使用的东西吗?
答案 0 :(得分:0)
我认为pd.merge(Ds01,Ds02,how="outer")
应该有用。