Solr中同一核心的多种语言

时间:2014-12-10 05:01:50

标签: solr lucene

我正在电子商务网站上实施Solr。现在,由于电子商务网站支持多种语言,我只想知道如何在单个solr核心中管理多种语言?我对一个领域的多语言有所了解。任何人都可以建议我如何在一个字段中索引和查询多种语言?任何一个例子?

谢谢!

2 个答案:

答案 0 :(得分:0)

您可以在一个字段中使用多种语言。它当然会损坏'您的频率向量和术语频率,但如果您使用特定于语言的过滤查询进行查询,例如fq:en,则术语频率将仅校准为。

无论如何,我建议您将常用字段用于与语言无关的任何内容(ID,类别,数量等),但您可以在自己的字段中保存描述和标题,例如' description_en', ' title_en&#39 ;.

对于特定于语言的方法,您可以定义特定的语言分析器以优化搜索和索引效率,请查看https://wiki.apache.org/solr/LanguageAnalysis

然后,要访问这些字段,您可以根据用户语言或商店国家/地区定义要索引/查询的字段。

答案 1 :(得分:0)

SolrUser邮件列表中已详细讨论过这个问题。没有简单的解决方案,这完全取决于权衡。邮件列表在Google上不可见,但您可以search it with specialized interface

但其他选项是分别索引语言,然后使用eDisMax搜索所有变体。我在GitHub上有an example(来自我的书)。