SOLR索引每种语言/多语言的SQL数据

时间:2017-09-26 09:01:02

标签: indexing solr multilingual

我知道有关于SOLR的类似问题,有些人会提供见解,但不能解决我想要做的事情。

我想创建一个具有多语言数据的核心。 例如,可以使用 description_fr,description_en 等字段。我想在请求用法语发送数据时发送描述fr并且不发送description_en。

我的一些问题:

  1. 如何定义要编入索引的数据
  2. 如何告诉应用程序针对字段的英语或法语版本请求搜索?
  3. 非常感谢

1 个答案:

答案 0 :(得分:0)

我建议最近柏林流行语[1]

向我的一位朋友发表演讲

这对你未来很有意思。

坚持你当前的问题我会继续识别查询的语言(这是一项艰巨的任务,因为查询通常由几个术语组成)。 然后,根据语言,我将向Solr发送一个请求,仅返回内容的1个存储字段。

e.g。

在索引中我有:

description_it,description_en

q =“prodotto scalare” 语言识别:它

请求:http://localhost:8983/solr/select?q=prodotto scalare& fl = description_it

您只需要一个库来检测语言[2]以及语言ISO代码和您的solr字段之间的映射。 您可以在API时间或直接在Solr中作为插件构建它。

[1] https://berlinbuzzwords.de/sites/berlinbuzzwords.de/files/media/documents/embracing_diversity_searching_over_multiple_languages.pdf

[2] 几个流行的例子: 蒂卡 - https://www.programcreek.com/java-api-examples/index.php?api=org.apache.tika.language.LanguageIdentifier Google - https://github.com/shuyo/language-detection