我正在做一个项目,该项目需要将丢失的数据从一个Excel工作表填写到另一个工作表。例如:
table A:
card name address zipcode
123 steve chicago 60601
321 Joy New York 10083
222 Andy San Francisco 43211
table B:
card name address zipcode
321 steve nan nan
123 Joy nan nan
123 nan nan nan
对于这个项目,我需要根据表A填写表B。我确实有使用Excel VLOOKUP
函数来填写所有列的想法,但是我想数据文件的数量是否会增加将来,那么我可以使用python来做到这一点。 (例如,相同的数据格式,但来自不同的分支)
在Python中,merge
函数可以完成此操作,但是会花费太多时间。在pandas,numpy或任何其他第三方库中是否有任何有用的功能可以帮助我做到这一点?谢谢大家!
这是我尝试过的:
df.merge(table A, table B, on = 'card', how = 'right')
它确实有效,但是我必须重命名列以匹配每个功能。而且我也知道我们可以在SQL上快速高效地做到这一点,只想在python上做到这一点:)
答案 0 :(得分:2)
当然,熊猫库可以做到这一点以及更多。我目前正在编写商业智能程序。我对熊猫做了很多这样的操作 有很多方法可以执行此操作,但是由于我看不到您的代码,因此可以用最简单,最易懂的方式来执行此操作。转到您被卡住的位置。谢谢
searchdata = Atabledata[['name','adress','zipcode']]
for i in search['name']:
Btabledata.loc[Btabledata['name']== i, Btabledata['adress']] = Atabledata['adress']
Btabledata.loc[Btabledata['name'] == i, Btabledata['zipcode']] = Atabledata['zipcode']
print(Btabledata)