多语言Solr设置

时间:2013-11-30 21:23:34

标签: solr

我有许多文件在许多语言中均匀分布(目前有6种语言,可能在不久的将来有12种语言)。没有必要猜测文档的语言,因为该信息是可用的。

此外,搜索的用例是一次搜索将始终使用一种语言,并仅搜索该语言的文档。

现在,我希望对索引和查询应用适当的语言处理,例如词干。建议的方式是什么?从我有限的Solr知识,我可以想象:

  • 每种语言只使用一个核心。保持索引较小,查询与核心URL匹配,配置简单。但是,它复制了大量配置。
  • 使用一个核心并应用Solr: DIH for multilingual index & multiValued field?之类的内容。搜索特定语言不是通过title_de:sehen
  • 等字段进行的

2 个答案:

答案 0 :(得分:1)

我确信每种语言的核心是最佳解决方案。

您可以在核心之间共享除schema.xml之外的所有配置(使用单个conf文件夹)并指定每个核心的schema.xml位置(选中http://wiki.apache.org/solr/CoreAdmin

答案 1 :(得分:0)

我选择了单核心。重复配置令人生畏。现在它只是一个核心。有点Java魔术,而且效果很好。