ETL Spring批处理,Spring云数据流(SCDF)

时间:2019-01-11 12:24:15

标签: spring-batch spring-cloud-dataflow

我们有一个用例,数据可以从不同的来源(DB,FILE等)获取,并转换并存储到各种接收器(Cassandra,DB或File)中,我们希望能够拆分作业并进行并行加载-看起来像Spring Batch RemoteChunking提供了该功能。

我是SCDF和Spring批处理的新手,想知道使用它的最佳方法是什么。

是否可以为这些作业(源连接详细信息,表和查询)提供配置,并且可以通过UI(SCDF Server UI)完成此配置。可以组成流程吗?

这将在Kubernetes上运行,并且我们的应用程序通过Jenkins管道进行部署。

1 个答案:

答案 0 :(得分:2)

  

我们希望能够拆分工作并进行并行加载-看起来像Spring Batch RemoteChunking提供了该功能。

我认为您不需要远程分块,您可以运行并行作业,其中每个作业都处理一个ETL进程(对于特定文件,db表)。

  

是否可以为这些作业(源连接详细信息,表和查询)提供配置

是的,可以像配置任何常规的Spring Batch作业一样配置它们。

  

并且可以通过UI(SCDF Server UI?

如果通过作业的属性使它们可配置,则可以在运行任务时通过UI指定它们。

  

是否可以构成流程?

是的,Composed Task可以实现。