标签: solr lucene
我一直在使用标准分析器在Lucene中进行索引和搜索。我最近遇到了Shingles(2个单词shingles \ bigrams),我在研究中发现的唯一优势是短语搜索会更快。 在不利方面,我的指数大小增加了。 我不太确定使用带状疱疹可以使我的应用程序有什么真正的优势\功能。 如果我使用Shingles / NGramTokenizer标记我的文档进行索引,它会如何影响我的其他现有搜索(Stem \ Fuzzy等搜索)?
有人可以就这个话题说清楚吗?