水壶台输入螺纹

时间:2018-09-28 18:55:53

标签: multithreading kettle pdi

当我在Kettle上运行具有表输入的转换时,如果访问数据库的进程列表,则会看到在表输入步骤的MySQL中运行多个进程。

所以我的问题是,是使用线程运行该步骤吗,还是其他东西?

1 个答案:

答案 0 :(得分:0)

水壶是Dataflow programming language。这意味着转换的每个步骤都在自己的线程上运行,而与其他步骤无关。

每个线程都等待输入步骤中的数据,对其进行处理,然后将其传递到输出步骤中。数据以大约1000行为一组进行分组,以优化速度。

这种同时处理所有步骤的灵活性具有许多优点,并解释了一些其他奇怪的行为,例如,执行历史记录表(位于底部)中的步骤数通常是1000的倍数,并且自动锁定问题:当您输入要在输出表中也被截断的表时,然后Kettle输入自动锁定,每个步骤都等待另一个步骤完成。