据我所知,几乎所有人都根据单个查询字词进行拼写检查,并且无法对整个输入查询进行更改以增加语料库中的覆盖率。我有一个在lingpipe但它是非常昂贵的...... http://alias-i.com/lingpipe/demos/tutorial/querySpellChecker/read-me.html
所以我的问题是什么是最好的Apache替代Lingpipe像拼写检查器?
答案 0 :(得分:0)
lucene中的拼写检查器像任何其他角色一样对待空白。因此,通常您可以向他们提供查询日志或其他内容,并拼写检查/自动填充完整查询。
对于lucene,这应该可行,对于solr,您需要确保QueryConverter不会拆分您的条款...请参阅https://issues.apache.org/jira/browse/SOLR-3143
另一方面,这些建议器目前在整个输入上工作,所以如果你想建议之前从未被搜索过的查询,那么你想要的东西可能只需要最后N个上下文单词{{3 }}。
我希望我们很快也能提供这种建议方式作为替代方案,可能在http://googleblog.blogspot.com/2011/04/more-predictions-in-autocomplete.html下。
但请记住,这不适用于所有目的,因此我认为它可能只是一种选择。例如,如果您正在进行电子商务,那么建议您不销售的产品是毫无意义的。)