我应该使用哪种弹性分析仪?

时间:2013-06-20 20:32:31

标签: elasticsearch tokenize analyzer

我正在为大约有100,000个条目的视频游戏创建一个搜索引擎,并希望使用Elasticsearch对它们进行索引。

我玩了一些分析仪配置,但我不太确定哪种配置最适合ecommence产品。

我目前的设置如下:

:filter => {
  :en_stop_filter => {
      "type" => "stop",
      "stopwords" => ["_english_"]
  },
  :en_stem_filter => {
      "type" => "stemmer",
      "name" => "minimal_english"
  }
},
:analyzer => {
  :ja_analyzer => {
        "type" => "custom",
        "tokenizer" => "kuromoji",
        "filter" => ["icu_folding", "icu_normalizer"],
        "char_filter" => ["html_strip"],
        "mode" => "search"
  },
  :en_analyzer => {
              "type" => "custom",
              "tokenizer" => "icu_tokenizer",
              "filter" => ["icu_folding", "icu_normalizer", "en_stop_filter", "en_stem_filter"],
              "char_filter" => ["html_strip"]
  }
},
:tokenizer => {
  :kuromoji => {
      "type" => "kuromoji_tokenizer",

  }
}

en_analyzer用于英文标题,ja_analyzer用于日文标题。

我应该使用ngrams,还是尝试其他类型的分析仪? 我很难比较搜索结果;也许有人在电子商务搜索方面有一些练习,可以帮助我。

0 个答案:

没有答案