希望这个问题不会过时,但我还没有找到明确的答案。根据去年的一个ES演示文稿(http://www.elasticsearch.org/videos/big-data-search-and-analytics/),一个碎片的“最大”大小。我正在尝试为我的应用程序确定这个,但据我所知,我还没有打到它。有谁知道单个分片索引的行为达到了最大值?插入是否失败,或仅仅是索引变得无法使用?
答案 0 :(得分:13)
为了自己测试,我在一个elasticsearch分片中索引维基百科中的所有英文文章(没有任何历史信息)。弹性搜索数据文件夹在测试结束时增长到~42GB。经验教训是:
我的结论是,一个太大的分片不会仅仅因为索引而使弹性搜索失败。查询大型分片可能对您的需求来说太慢,或者在某些情况下,甚至会使用OutOfMemoryException(例如,大型分面查询)来破坏elasticsearch。
这个答案是基于我自己的调查。全文可以在我的博客上阅读:
http://blog.trifork.com/2013/09/26/maximum-shard-size-in-elasticsearch/
http://blog.trifork.com/2013/11/05/maximum-shard-size-in-elasticsearch-revisited/