我使用NiFi在远程Hive上执行一些查询
由于查询很复杂而且没有选择任何东西,我需要使用PutHiveQL
处理器,它需要查询为FlowFile。
使用GenerateFlowFile
后跟ReplaceText
来生成对流文件的查询。
群集有3个主机,查询执行3次。
有没有办法以简单的方式生成/执行此查询一次?
为避免重复,我尝试使用HashContent
后跟DetectDuplicate
,我面临缓存持久性问题。
如何使用处理器从DistributedMapCacheService
删除条目?
有没有办法设置存储在DistributedMapCacheService
中的每个条目的TTL?
答案 0 :(得分:3)
您可以安排GenerateFlowFile处理器在"仅主节点上运行"从处理器的调度选项卡。这将导致只有集群中的主节点执行该处理器,因此只执行一个查询。