我正在尝试编写文本分析器来查找和订购与用户输入的文本相似的文档,但是我无法达到所需的结果。
这是我想要实现的目标:
应用令牌生成器并过滤到将文本解析为令牌的文档名称字段。我将其用于索引分析器:
<tokenizer class="solr.NGramTokenizerFactory" minGramSize="2" maxGramSize="15"/>
<filter class="solr.LowerCaseFilterFactory"/>`
how many tokens of user entered word contains stored documents
例如:
hel
,他将找到包含hell
,helium
,hello world
,... helo word
时,我需要增强文档文本hello world
,因为此文档匹配更多的令牌,例如helium
或hell
。您能告诉我什么样的文本分析器才能实现我的搜索目标?我只是从Solr开始,所以我会很乐意提供任何建议。谢谢。