标签: java lucene search-engine stemming lemmatization
Lucene默认搜索会对单词进行词形还原/词干化吗?
Lucene
例如,当使用此sample中的代码时,文档中的单词是按原样使用还是转换为基本形式(即Managing - > manag),如果是,则默认的lemmatizer会执行什么操作它用吗?
答案 0 :(得分:1)
您帖子中提到的示例使用Lucene StandardAnalyzer,它不会阻止。
如果你想使用词干,你需要使用其他分析器实现,例如:SnowballAnalyzer