Kafka:从SQL Server读取并启用更改跟踪

时间:2018-11-08 18:00:17

标签: sql-server apache-kafka apache-kafka-connect cdc debezium

我一直试图将数据从SQL Server(启用了更改跟踪)加载到Kafka中,以便可以被一个或多个系统(报告,其他数据库等)使用

我已经成功配置了用于SQL Server的Kafka连接插件(confluentinc / kafka-connect-cdc-mssql:1.0.0-preview),并且还设法在kafka机器上启动了它。

我一直在寻找文档(找不到任何文档)来帮助回答以下问题

  1. 如何将kafka主题与此连接相关联?
  2. 根据我发现的信息(在debezium论坛上),将为每个表创建一个主题->它与kafka sql服务器连接器的工作方式是否相同?
  3. 我已将连接配置为分布式模式,我们在多台服务器上运行kafka,是否需要在每台服务器上运行连接?
  4. 是否有人将Debezium与sql服务器更改跟踪和kafka一起使用? Debezium的网站在“ alpha阶段”中描述了这种连接,我想知道是否有活跃用户。

PS:我还接受其他选择,用于将实时数据从sql Server加载到Kafka(带有时间戳/数字字段的jdbc连接是我的备份选项。由于我的源数据库中有一些表可以执行此操作,所以是备份选项)不包含此类字段(没有更改并且不能使用数字/时间戳字段跟踪更改))。

1 个答案:

答案 0 :(得分:0)

  

1&2-如何将kafka主题与此连接相关

我相信它是针对每个表的,但是您可以使用RegexRouter Connect转换将多个表合并为一个主题。

  

3-以分布式模式配置连接,我们在多台服务器上运行kafka,是否需要在每台服务器上运行连接

Kafka Connect应该在您的Kafka服务器之外运行。它是独立可伸缩的。

  

4-具有SQL Server更改跟踪的Debezium

我还没有。可以向使用这些功能的Debezium邮件列表或JIRA票问一个更好的问题。