我正在使用Lawrence Philips Double-Metaphone算法取得了巨大成功,但我发现某些组合出现奇怪的“意外结果”。
是否有其他人对算法的其他部分添加或更改,他们不介意分享,或者只是他们发现的组合无法按预期工作。
例如。我之间有问题:
答案 0 :(得分:5)
所有Soundex,Metaphone和变体计划偶尔会给出与您的预期不同的结果。这是不可避免的 - 它们可以被视为具有保留属性的特殊信息的或多或少的简单哈希算法,并且当你宁愿它们没有时,它们有时会产生冲突,并且当你宁愿它们没有时,它们有时会产生差异。
改善事物的一种可能方法是使用“同义词环”。这基本上产生了应该被视为同义词的单词列表,与拼写无关。我在名称匹配的上下文中遇到过它们。例如,Chaudri的变种 包括:
CHAUDARY CHAUDERI CHAUDERY CHAUDHARY CHAUDHERI CHAUDHERY CHAUDHRI CHAUDHRY 乔杜里 乔杜里 CHAUDHY 绍德雷 CHAUDRI 乔德里 CHAUDURI CHAWDHARY CHAWDHRY CHAWDHURY CHDRY CHODARY CHODHARI CHODHOURY CHODHRY CHODREY CHODRY CHODURY CHOUDARI CHOUDARY CHOUDERY CHOUDHARI CHOUDHARY CHOUDHERY CHOUDHOURY CHOUDHRI 乔德里 CHOUDHURI 乔杜里 CHOUDREY CHOUDRI CHOUDRY CHOUDURY CHOUWDHRY CHOWDARI CHOWDARY CHOWDHARY CHOWDHERY CHOWDHRI 乔杜里 CHOWDHURI CHOWDHURRYY CHOWDHURY CHOWDORY CHOWDRAY CHOWDREY CHOWDRI CHOWDRURY CHOWDRY CHOWDURI CHOWDURY CHUDARY CHUDHRY CHUDORY COWDHURY
答案 1 :(得分:-1)
Peashill PXL Bushley BXL