标签: lucene
我对学习lucene如何配置不同语言感兴趣。有没有办法知道如何配置tokenizer以及哪些字符被认为是单词的一部分,哪些不是?
答案 0 :(得分:0)
默认情况下,Lucene未配置为处理语言。这取决于你,我的建议是将不同文档字段中的多种语言编入索引,每种语言都用于一种语言,并且每次都使用适当的分析器。
所以Lucene没有默认配置,但如果您使用Elasticsearch或Solr,可能会有。你是否开箱即用Lucene?
问候,