什么样的TokenizerFactories应该将单词拆分为某些字符, 就像'abc'=> 'A', 'B', 'C' 我使用了一些TokenizerFactories,如KeywordTokenizerFactory,WhitespaceTokenizerFactory,StandardTokenizerFactory.etc。 但我没有完成它。 谁能帮助我,非常感谢!
答案 0 :(得分:1)
您需要使用FilterFactory
以及所需的TokenizerFactory
。 NGramFilterFactory
可能符合您的利益。看一下documentation。