通过最频繁的单词自动完成 - postgres或lucene?

时间:2016-11-26 22:36:04

标签: postgresql autocomplete lucene full-text-search trigram

我们正在使用Postgres及其全文功能在我们的系统中搜索文档(帖子内容),而且效果非常好。

对于自动完成,我们要构建索引(字典?),其中包含文档中使用的所有单词,并按最常用的单词进行搜索。 我们总是会搜索一个单词。我们永远不会搜索短语。

所以,如果我写:

  • "第"

我会收到(假设我们文件中最常用的词):

  • "这"
  • "还有"
  • "思想"
  • ...

如何用Postgres做到这一点?或者我们需要一些更先进的解决方案,如apache lucene / solr?

postgres全文搜索(提供lexems)和postgres trigrams似乎都不适合这项工作。或者我错了?

我不想手动解析文本而忽略所有容易出错的英语停用词。 Postgres在构建lexems索引时做得很好。但是,如果没有规范化,我们需要建立和搜索单词字典

感谢您的帮助

0 个答案:

没有答案