Apache Solr:条件块

时间:2015-04-10 12:08:44

标签: indexing solr hbase bigdata

我正在读取HBase中的列,并使用morphines文件在Solr中对其进行索引。某些字段值可以是英语或德语。有没有办法将字段的类型指定为“text_english_german”,在“text_english_german”的定义中,我们可以进行条件检查以查看它是英语还是德语,并使用特定于语言的Stemmer过滤器工厂进行索引和查询数据?

谢谢, 基肖尔马布

1 个答案:

答案 0 :(得分:0)

使用稍微不同的方法,您可以定义两个字段:

  • text_en
  • text_de

每个人都会配置特定于语言的文本分析。然后,您可以使用语言自动检测UpdateRequestProcessor [1]。有很多参数可以调整这种组件的行为。


[1] https://wiki.apache.org/solr/LanguageDetection
[2] https://cwiki.apache.org/confluence/display/solr/Detecting+Languages+During+Indexing