我有一个由5个经纪人和4个镜像制造商组成的Kafka集群,用于镜像来自2个不同数据中心的日期。我知道kafka代理需要自己的专用硬件,特别是因为磁盘I / O,内存使用率和CPU密集型应用程序都很高。
我想知道在一个甚至是Kafka经纪人的节点上部署镜像制造商流程是否有意义,或者我是否应该考虑让镜像制造商开启:
HDFS和其他cloudera服务部署在不同的节点上。
提前致谢, 亚塔
答案 0 :(得分:0)
MirrorMaker只是一个普通的Java Producer / Consumer对。
如果您编写了一个从远程数据中心读取的应用程序,那么在自己的硬件上运行它是否有意义?你有资源吗?我个人不会在经纪人或动物园管理员身上经营它。
如果您在可用Docker或Kubernetes的数据中心中运行,则可以将所有镜像实例部署在自己的容器中。或者,您可以使用正则表达式白名单模式在一个JVM中运行所有主题。
但是,您选择部署,建议让MirrorMaker的使用过程位于远程数据中心,以便将数据提取并生成到本地群集。