为什么Nifi PutParquet处理器会创建这么多任务?

时间:2019-06-17 12:31:28

标签: apache-nifi

Nifi PutParquet Processor(由计时器驱动的运行计划为0秒,并且先前的处理器处于停止状态)在最近5分钟内显示约3000个任务。

Example of the high amount of tasks

我们使用的是Nifi 1.9.2。

我希望该处理器仅在处理器的传入队列中有数据时才创建任务。这是配置错误还是实施中的错误?

1 个答案:

答案 0 :(得分:3)

该处理器带有@TriggerWhenEmpty批注,该处理器可以使它始终执行,而不管传入队列中的数据如何。其原因是因为在kerberized环境中,处理器需要一个机会来刷新凭据。这是其他处理器的一个普遍问题,即长时间没有数据输入,例如在一个周末,而在那段时间内,kerberos票证过期了,然后当星期一开始有数据输入时,一切都会失败。

这些空的执行不会对系统产生很大的影响。当处理器执行并且没有可用数据时,它仅调用yield和return。默认的持续时间为1秒,但可通过UI进行控制。