在Solr中英语搜索和日语搜索之间的正确平衡

时间:2014-08-12 13:39:44

标签: solr

我正在使用Solr一段时间。它与英语一起工作正常。现在还包括日文文件。这里出现了一个主要问题。

当我在寻找日语时,会给出不恰当的结果。我试图使用kurumoji但我不知道如何配置它。我无法同时找到日语和英语的解决方案。

1 个答案:

答案 0 :(得分:1)

由于您在编制索引之前不了解该语言,因此您可能希望在更新处理器中使用Solr's Language Detection。这将尝试检测内容所在的语言,然后将内容索引到后缀为语言代码的字段(请参阅langid.map)。这样,您可以为每种语言分别使用分析和过滤序列,使用接收日语内容的字段的日语功能,以及英语字段的英语内容功能(词干/等)。

如果要在查询时搜索这两个字段,请使用qf(如果使用(e)dismax查询解析器)查找在任何字段中匹配的文档。