我正在尝试开发一种将租户申请人数据与公共记录进行匹配的方法。我们需要名称加上以下内容之一:DOB,SSN,地址,DL。
我们可以匹配姓名+ SSN,地址历史记录,DL;但是,我们正在努力解决名称+ DOB的问题。例如,在公共记录数据中,我们可能有很多约瑟夫·史密斯(Joseph Smiths)出生于1972年5月6日。
我正在尝试开发一种方法,以减少具有通用名+ DOB匹配项时需要人工审核的案件数量。我正在寻找一个案例的置信度分数(并最终设置一个置信度阈值,以将案例发送给人工审核或确认我们自动有一个匹配项)。
有什么建议吗?有想法吗? (根据年份的流行程度,我在想某种自信)从哪里开始?