我有两个数据帧,其中每个数据帧都包含一个称为“ ID”的列。面临的挑战是比较这些ID,然后将一个数据帧的正确值分配给另一个数据帧。
即:我想在第一个数据帧中添加一个新列,而此列包含数据帧2中的新信息,但顺序正确。.并且该顺序由“ ID”确定
由于数据帧包含每行约10万行,因此两个for循环花很长时间才能找到并替换值。有什么想法可以加快这个过程吗?
我的第一种方法:
for i in range1:
for j in range2:
if df1["ID"][i] == df1["ID"][j]:
df1['feature'][i] = df2['feature'][j]
在这里我也为df1创建了列功能。我考虑过在每次替换正确的值后删除该行以改善此过程,但我没有按预期工作
谢谢