最近邻匹配替换Python

时间:2018-06-22 01:19:58

标签: python matching knn nearest-neighbor

我有2个数据框df_test和df_control。对于df_test中的每个元素,我都在基于feature_list的df_control中寻找最接近的匹配项。

我已经在scikit-learn(也是this answer)中看到了NearestNeighbors函数。但是,此功能不提供不更换采样的选项。因此,df_control中的单个元素可能与df_test中的多个元素匹配。

如果我想进行“贪婪”比赛,有人可以指出我应该看的地方吗? R有一个名为MatchIt的程序包,其中“最近邻居”匹配完全符合我的要求,但是我无法在Python中找到它。预先感谢。

0 个答案:

没有答案