metaphone与soundex对比NYSIIS

时间:2012-07-20 11:35:00

标签: machine-learning nlp soundex phonetics metaphone

我试图想出一个隐式拼写检查程序,它会使用输入单词的映射到某种更一般的语音表示来解释可能发生的拼写错误,基本上对于会自动更正的搜索栏你的拼写程度。我一直在研究的两件事是metaphone,nysiis和soundex,但我真的不知道哪个更适合这个应用程序。

我希望优先选择更多的匹配而不是更少的匹配,我希望匹配更加通用,因此我考虑使用soundex,这似乎是一个比最初的互联网电话,但我真的不知道模糊的差异有多大。我知道nysiis与soundex非常相似,但我不知道它们有多相似,或者nysiis与metaphone相比如何。

我也在寻找最快的解决方案。我知道这些语音映射器通常非常快,但我不确定哪个是最快的,考虑到我希望能够在不增加搜索时间的情况下检查拼写,速度是一个考虑因素。想法?

1 个答案:

答案 0 :(得分:11)

我设法在这里找到了一篇很棒的文章:

http://www.informit.com/articles/article.aspx?p=1848528

不是我想要的所有东西,但是相当多的东西。