Kafka和IIDR CDC

时间:2018-11-18 12:33:25

标签: apache-kafka db2 confluent cdc ibm-infosphere

我正在尝试使用以下方式建立CDC管道: DB2--IBM CDC --Kafka 我正在尝试找出正确的方法来进行设置。 我在下面尝试了-

1。在prem的linux上设置3节点kafka集群

2。使用-setup-iidr-11.4.0.1-5085-linux-x86.bin file在prem上的linux上安装了IIDR CDC软件。 CDC实例已启动并正在运行。

各种在线文档建议安装“ IIDR管理控制台”以配置源数据存储和CDC服务器配置以及Kafka订阅配置以构建管道。

当前我没有安装管理控制台。 几个问题-

1.IBM CDC管理控制台是否可以用于设置kafka-CDC管道?

2。如何获得IIDR管理控制台?如果我们将其安装在本地Windows dekstop上并尝试连接到远程linux服务器上的CDC / Kafka,它将起作用吗?

3。是否有其他方法可以将数据摄取IIDR CDC设置为Kafka?

我对CDC / IIDR还是陌生的,请帮忙!

1 个答案:

答案 0 :(得分:4)

我拥有CDC复制产品的IIDR Kafka目标的开发。

管理控制台是最初设置订阅的最佳方法。您可以将其安装在Windows框上。

从技术上讲,我相信您也可以使用称为CHCCLP的脚本语言来设置订阅。但是我建议使用GUI。

以下是指向IIDR(CDC)卡夫卡目标的资源的链接。搜索“卡夫卡”部分。

https://www.ibm.com/developerworks/community/wikis/home?lang=en#!/wiki/W8d78486eafb9_4a06_a482_7e7962f5ac59/page/IIDR%20Wiki

此视频的一个设置订阅和复制的示例

https://ibm.box.com/s/ur8jokg6tclsx5fcav5g86a3n57mqtd5

管理控制台和访问服务器可以从IBM Fix Central获得。

我已在VM和个人窗口框中安装了MC / Access服务器,以将其用于Linux VM。当然,您将需要连接。

您当然可以跟进我们的支持,他们将能够解决您的问题。另外,我们从MC的知识中心开始拥有文档,从这里开始...... https://www.ibm.com/support/knowledgecenter/en/SSTRGZ_11.4.0/com.ibm.cdcdoc.mcadminguide.doc/concepts/overview_of_cdc.html

您会发现我们的Kafka目标非常灵活,它具有五种不同的格式将数据写入Kafka,并且您可以选择以审计格式或Kafka压缩兼容键来捕获数据,对于delete方法,该键为null。

此外,您甚至可以使用该产品通过一次插入操作以几种格式将多个记录写入几个不同的主题。如果您的某些消费者应用程序需要JSON,而另一些Avro二进制文件则非常有用。另外,您可以使用此功能将所有数据放在更安全的主题上,并仅将一些数据写出更多人可以访问的主题。

我们甚至有客户在复制时对正在传输的列进行加密。

最后,即使您选择仅使用一个生产者来写出数据,也可以并行化产品的转换。

最后,实际上,我们还提供了使用特殊使用者的选项,该使用者为写入Kafka并跨越主题和分区的数据生成数据库ACID语义。它重新排序。我们称其为交易一致的消费者。它提供了操作顺序,用于重新启动应用程序的书签,并允许性能并行化,但仅对重复数据删除进行了一次排序。

我在卡夫卡峰会上的演讲...

https://www.confluent.io/kafka-summit-sf18/a-solution-for-leveraging-kafka-to-provide-end-to-end-acid-transactions