假设我有100个表,我想将它们放在Elasticsearch中。每个表有10个字段,这100个表中有1000万行数据。
如果将每个表放入一个不同的索引或将所有表放入一个具有1000个字段的索引,那么性能会有什么不同?
答案 0 :(得分:0)
这取决于表的紧密程度。让我们两种情况一一对应。
1。不同索引中的所有10个表::如果所有表都不相互关联,即可以对所有表单独执行搜索操作,并且您无需将这些表联接即可获得所需的结果,为所有索引创建单个索引是一个更好的选择,因为数据将被分发并且搜索操作应该更快。
2。一个索引中包含1000个字段的所有表:如果表是相关的,并且您将需要执行联接操作以获得搜索操作所需的结果,则最好对数据模型进行非规范化以适合所有1000一个索引中的字段。在Elasticsearch中进行搜索操作期间加入索引非常昂贵。
请进一步参考link。