所以,我习惯使用jaro_winkler和其他来匹配我们的客户提供给我们的叮咬,并使用这些pcts在我们的数据库中找到客户,因为我们没有像其他大多数地方那样拥有密钥,例如SSN ,SIN,CPF和类似的东西,我们不能向客户询问这个信息,所以...事情是,我试图使用我以前使用的相同的jaro_winkler函数,但现在,让客户能够输入1错字在他们出生日期错了,但是,现在是坏的部分,取决于处理错误的错字,它不断改变结果,我已经计算0.96作为预期结果一旦客户发错了...但是,正如你可以看到的那样,取决于我改变错字的地方,它不断给我不同类型的结果。
将年度最后一次错字从60改为61
SELECT UTL_MATCH.jaro_winkler ('12/10/1961','12/10/1960') FROM DUAL;
但使用不同的日子,也可以使用一个拼写错误,如下所示
SELECT UTL_MATCH.jaro_winkler ('11/10/1960','12/10/1960') FROM DUAL;
pct`下降ALOT并转到0.873333333333333
我试图结合很多关于1个错误拼写的不同类型的更改,结果每次都会改变,这取决于我的数据集,处理方式等等,所以,我想知道是否有办法设置匹配更多〜静态〜也许,只是比较整个刺痛并给我结果基于整个刺痛而不是基于处置和其他
Plues,香港专业教育学院尝试使用不同种类的面具,如YYYYMMDD,否则,到目前为止没有任何作用..