只是开始探索Druid,我们在链接上找不到任何博客可在AWS上安装Druid,是否有机会在AWS EMR上安装Druid?如果是这样,那么如果有任何定义的云形成要执行,这将对我在Druid上的研发完全有所帮助。
答案 0 :(得分:0)
设置基本的单集群德鲁伊很简单
tar -xzf imply-3.1.8.1.tar.gz cd imply-3.1.8.1
bin/supervise -c conf/supervise/quickstart.conf
如果您正在寻找完整的集群部署,则EMR不是正确的工具。 如果您知道EKS / kubernetes,我认为最简单的入门方法是使用Helm https://github.com/helm/charts/tree/master/incubator/druid
其他选择是寻找隐含云 他们还提供有关Druid的可靠文档。德鲁伊自己的文档非常紧张。我发现暗示对初学者更好。 https://docs.imply.io/cloud/
尽管对于POC,单个r3.4xlarge或i3.4xlarge具有200G的存储就足够了
答案 1 :(得分:0)
您找不到太多文档的最可能原因是这两件事的性质不同。
德鲁伊的生命长寿且充满状态,其中EMR hadoop变体旨在以更短暂的方式上下旋转。因此,这种组合有些尴尬。
请考虑使用其他HDD之类的hadoop发行版。当然,如果需要,您可以轻松地将其部署在AWS上;如果希望将基础设施成本降至最低,则可以将其部署在自己的硬件上。
免责声明:我是HDP发行商Cloudera的雇员,该公司目前是Druid下最常见的hadoop平台。