hadoop - Hadoop上的Elasticsearch - ES节点是否应该与Hadoop DataNodes共存？

Hadoop上的Elasticsearch - ES节点是否应该与Hadoop DataNodes共存？

时间：2014-06-24 21:19:49

标签： hadoop elasticsearch

来自Elasticsearch for Hadoop documentation：

只要有可能，elasticsearch-hadoop就会共享Elasticsearch 使用Hadoop集群信息以促进数据协同定位。在实践，这意味着每当从Elasticsearch读取数据时，源节点IP传递到Hadoop以优化任务执行。如果需要/可能共址，托管Elasticsearch和同一机架内的Hadoop集群将提供重要的网络节省。

这是否意味着理想情况下，Elasticsearch节点应该与Hadoop集群上的每个DataNode共存，或者我误读了这个？

1 个答案:

答案 0 :(得分：0)

您可能会发现Elasticsearch和Hortonworks的联合演示在回答这个问题时非常有用：

http://www.slideshare.net/hortonworks/hortonworks-elastic-searchfinal

您将注意到，在幻灯片33和34上，它们显示了多个体系结构 - 一个ES节点位于Hadoop节点上，另一个节点位于Hadoop节点上。第一个选项显然为您提供了最佳的数据共存位置，这对于管理Hadoop性能非常重要。第二种方法允许您分别调整每个方法并独立缩放它们。

我不知道你可以说一种方法比另一方更好，因为有明显的权衡。在同一节点上运行可以明显地最小化数据访问延迟，但代价是失去隔离并且能够单独调整每个集群。