我正在玩Kafka-Connect。我在stand-alone mode和distributed mode中都HDFS connector
工作了。
他们advertise工作人员(负责运行连接器)可以通过YARN
进行管理但是,我还没有看到任何描述如何实现这一目标的文档。
如何让YARN
执行工作人员?如果没有具体的方法,是否有关于如何让应用程序在YARN
内运行的通用方法?
我已使用YARN
将spark-submit
与SPARK结合使用,但我无法弄清楚如何让连接器在YARN
中运行。
答案 0 :(得分:7)
理论上你可以在YARN上运行任何东西,甚至是一个简单的hello world程序。这就是说Kafka-Connect在YARN上运行的原因在技术上是正确的。需要注意的是,让Kafka-Connect在YARN上运行将会使用相当数量的肘部油脂。有两种方法可以做到:
您必须阅读相当多的文档才能使其正常工作,但Slider背后的想法是,您可以在YARN上运行任何程序而无需处理YARN API并通过执行编写YARN app master以下内容:
Slider为您处理容器部署和故障容器的恢复,这很好。当YARN 3.0发布时,Slider也正在成为YARN的原生部分。
另外作为旁注,让Kafka-Connect在Kubernetes或Mesos / Marathon上部署可能会更容易。这样做的基本工作流程是: