我有2个数据框df_test和df_control。对于df_test中的每个元素,我都在基于feature_list的df_control中寻找最接近的匹配项。
我已经在scikit-learn(也是this answer)中看到了NearestNeighbors函数。但是,此功能不提供不更换采样的选项。因此,df_control中的单个元素可能与df_test中的多个元素匹配。
如果我想进行“贪婪”比赛,有人可以指出我应该看的地方吗? R有一个名为MatchIt的程序包,其中“最近邻居”匹配完全符合我的要求,但是我无法在Python中找到它。预先感谢。