就性能而言,在为Elasticsearch指定同义词过滤器时,使用synonyms_path和使用同义词之间有什么区别吗?请参考图片。请注意,在我的ES群集中,有许多索引将使用同一个同义词过滤器。
我问这个问题,因为很明显AWS ES不允许将文件直接上传到群集。因此,我需要使用API上传同义词数据。
答案 0 :(得分:7)
您没有选择,因为您无法使用同义词文件。您唯一的选择是在索引设置中提供所有同义词。
代码方面,无论是从字符串还是从文件中读取同义词,它都会生成almost no difference。唯一的区别是所有的同义词都会存储在需要它们的所有索引中,所以归结为浪费了一点存储空间,但这可以忽略不计(当然这取决于你有多少个同义词,即几百个或者数千人。)
更糟糕的是,如果您需要修改同义词列表,则需要修改所有索引,而不是仅修改单个文件。