我有许多文件在许多语言中均匀分布(目前有6种语言,可能在不久的将来有12种语言)。没有必要猜测文档的语言,因为该信息是可用的。
此外,搜索的用例是一次搜索将始终使用一种语言,并仅搜索该语言的文档。
现在,我希望对索引和查询应用适当的语言处理,例如词干。建议的方式是什么?从我有限的Solr知识,我可以想象:
title_de:sehen
答案 0 :(得分:1)
我确信每种语言的核心是最佳解决方案。
您可以在核心之间共享除schema.xml之外的所有配置(使用单个conf文件夹)并指定每个核心的schema.xml位置(选中http://wiki.apache.org/solr/CoreAdmin)
答案 1 :(得分:0)
我选择了单核心。重复配置令人生畏。现在它只是一个核心。有点Java魔术,而且效果很好。