在config中直接指定同义词而不是使用synonyms_path有什么缺点

时间:2017-01-20 11:29:02

标签: elasticsearch

我有大约440 kB的文本文件和Elastic Search同义词。

目前,这些同义词只是放在每个节点的磁盘上,我使用配置属性synonyms_path

像这样的东西(来自文档)

{
  "filter" : {
    "synonym" : {
      "type" : "synonym",
       "synonyms_path" : "analysis/synonym.txt"
    }
  }
}

由于这些同义词会定期更新,因此在每个索引的过滤器配置中直接声明它们会更简单(参见示例)

{
  "filter" : {
    "synonym" : {
      "type" : "synonym",
       "synonyms" : [
         "i-pod, i pod => ipod",
         "universe, cosmos"
       ]
    }
  }
}

the documentation似乎不鼓励这样做:

  

但是,建议使用synonyms_path定义文件中设置的大型同义词,因为在内联中指定它们会不必要地增加簇大小。

所以我有两个问题:

  1. 在配置中直接指定同义词时有多大?
  2. 使用定义执行此类操作有什么缺点。具体来说,增加群集大小是什么意思?

0 个答案:

没有答案