不同语言的Lucene配置

时间:2015-02-28 09:12:45

标签: lucene

我对学习lucene如何配置不同语言感兴趣。有没有办法知道如何配置tokenizer以及哪些字符被认为是单词的一部分,哪些不是?

1 个答案:

答案 0 :(得分:0)

默认情况下,Lucene未配置为处理语言。这取决于你,我的建议是将不同文档字段中的多种语言编入索引,每种语言都用于一种语言,并且每次都使用适当的分析器。

所以Lucene没有默认配置,但如果您使用Elasticsearch或Solr,可能会有。你是否开箱即用Lucene?

问候,