您好,我是弹性世界的新手,我正在尝试寻找适合自己情况的最佳方法。我读了很多关于您需要多少个分片或最大数量的分片等信息,但是我不确定如何应用我阅读的所有内容。
我现在必须索引600GB的文档,在2个节点的群集上,每个节点将具有32GB的RAM和一个双核处理器。我试图找出创建索引的最佳方法是什么,以及为每个索引创建多少个分片。这些文件是发票或其他特定于一个月,一年和公司的文件。将来,此文档数量会增加。 我考虑了下一个场景,我将像这样创建和索引: 具有2个主要分片和1个副本的company_documentType_year。 问题是公司的数量超过250-300,每个公司的documentTypes数量可能超过5。一些公司没有几个文件,而其他很多文件。这些文档不仅用于存储,而且将来还会被大量查询。
我的问题是: 为每年为每个公司的每种文档类型创建索引的一种好方法(companyA_invoices_2019),还是应该创建一个文档类型为年份的索引(invoices_2019)并将所有公司的所有相关文档存储在该索引中?这两种方法如何影响搜索性能?