使用Snowball和SpellChecker的Lucene带回了奇怪的价值观

时间:2009-12-02 11:55:30

标签: lucene spell-checking snowball

我正在尝试使用Lucene.NET进行SpellChecker设置,除了类似以下的情况外,一切正常:

我在索引中有包含卫星的文字,我使用Snowball进行分析。

然后我创建一个SpellChecker索引并从中获取建议。通过“Satalite”时我得到的建议是“卫星”。

我假设这是因为Snowball将卫星拦截到卫星,因此SpellChecker将其作为建议返回。

除此之外是否存在这样我可以将两者结合使用,而不是为非词干创建一个额外的字段,以便拼写检查器可以检查它?

2 个答案:

答案 0 :(得分:0)

正如上面提到的Shashikant所说:

你是对的,这是因为干预造成的。不幸的是,词干不仅仅意味着搜索和外部搜索,它们可能毫无意义。即使我不知道除了多次存储之外的任何其他技术。该附加字段可以配置为存储尽可能少的信息以减轻负担。 - Shashikant Kore 12月2日14:08

答案 1 :(得分:0)

您是否考虑过将雪球过滤器生成的单词作为同义词?这是我要走的方向......不知道它会有多好用,但看起来似乎有道理。然后拼写检查将返回正确的单词,但我仍然可以进行搜索并找到词干变体。