我有一个快速增长的数据库,我使用Elastic Search来管理它。它只有一个索引,每天可获得200 K个新文档。每个文档包含大约5 KB的文本 我应该只使用一个索引,还是每天或其他东西有一个索引更好? 如果是这样,拥有多个指数的好处是什么?
答案 0 :(得分:2)
您一定要担心分片/索引的最大大小。我们使用每日索引来填充我们每天插入数百万条记录的内容以及每月插入数百万条记录的月度索引。
一个好的经验法则是碎片的最大值应大约为4 GB(请记住,每个索引的碎片数量可配置)。
优点是,当您有每日/每周/每月索引时,最终可以在群集变得太大或数据不再有用时关闭/删除它们。如果您的数据是时间序列数据,则可以将查询设置为仅命中用于给定数据的索引。此外,如果你在真正需要多少分片时犯了错误,你可以在前面纠正它(因为你定期创建一个新索引)。
缺点是你必须管理所有额外的索引,但有工具可以做到这一点(例如elasticsearch-curator)。