Solr n-gram以外的任何建议

时间:2011-12-21 09:55:17

标签: solr n-gram

我正在使用solr 3.5,但我遇到了一个问题。 我想要做的是将file1中的每一行与file2中列出的引用进行比较。但是在file1中,数据不一定正确写入。所以我决定使用nGram来用3到15的字母来剪切单词。 问题是当我将单词剪切为3时,引用匹配太多;但如果削减15,将没有匹配:( 谁有想法解决这个问题?

谢谢! 博

1 个答案:

答案 0 :(得分:0)

您可以尝试使用拼写检查组件。使用file2的字段作为字典。 请参阅教程http://wiki.apache.org/solr/SpellCheckComponent