apache-nifi:使用模板时如何避免重复

时间:2016-10-24 06:46:35

标签: apache-nifi

我使用NiFi在远程Hive上执行一些查询 由于查询很复杂而且没有选择任何东西,我需要使用PutHiveQL处理器,它需要查询为FlowFile。
使用GenerateFlowFile后跟ReplaceText来生成对流文件的查询。
群集有3个主机,查询执行3次。
有没有办法以简单的方式生成/执行此查询一次?

为避免重复,我尝试使用HashContent后跟DetectDuplicate,我面临缓存持久性问题。

如何使用处理器从DistributedMapCacheService删除条目? 有没有办法设置存储在DistributedMapCacheService中的每个条目的TTL?

1 个答案:

答案 0 :(得分:3)

您可以安排GenerateFlowFile处理器在"仅主节点上运行"从处理器的调度选项卡。这将导致只有集群中的主节点执行该处理器,因此只执行一个查询。