我正在读取HBase中的列,并使用morphines文件在Solr中对其进行索引。某些字段值可以是英语或德语。有没有办法将字段的类型指定为“text_english_german”,在“text_english_german”的定义中,我们可以进行条件检查以查看它是英语还是德语,并使用特定于语言的Stemmer过滤器工厂进行索引和查询数据?
谢谢, 基肖尔马布
答案 0 :(得分:0)
使用稍微不同的方法,您可以定义两个字段:
每个人都会配置特定于语言的文本分析。然后,您可以使用语言自动检测UpdateRequestProcessor [1]。有很多参数可以调整这种组件的行为。
[1] https://wiki.apache.org/solr/LanguageDetection
[2] https://cwiki.apache.org/confluence/display/solr/Detecting+Languages+During+Indexing