无法弄清楚如何使用此算法。
输入:任意数量的列表,每个列表包含按公共属性
分组的元素例如,
matched_by_first_name = {"bob" => [person, person, ...], "nancy" => [person, ...], ...}
matched_by_zip_code = {"12345" => [person, person, ...], "56789" => [person, ...], ...}
输出:在同一组中最常出现的人员列表,每个输入列表具有单独的“权重”。所以,我可能会给两个按同一个名字分组的人加权,而不是两个人用相同的邮政编码加权。
换句话说:
匹配= [[人,人],[人],[人,人,人]]
基本上,如果有两个人,并且对于每个分组他们属于同一组,那么他们肯定应该在同一个最终匹配组中。如果只有一个他们不在的组,那么他们可能仍然匹配(取决于该组类型的权重)。