我计划使用Nifi marklogic处理器从s3存储桶中提取文档。
aggregate_record_namespace
或transform_module
或transform_namespace
或transform_param
如您所见,我正计划调用DHF输入流。因此,在查看代码后,我认为可以将transform:ml:inputFlow
和其他变换参数设置为以trans:
为前缀。这是正确的吗?
当我正在加载具有多个xml文件的aggregates
文件时,我该如何执行mlcp aggregate_record_element
和aggregate_record_namespace
和.xml.gz
..或我唯一的选择是将它们分解为单个文件
答案 0 :(得分:0)
我解决了这个问题,编写了一个名为ContentPump.runCommand
的自定义处理器。只是,如果有兴趣的话,我必须排除log4j
并添加log4j-over-slf4j
,以便mclp可以将进度日志记录写入nifi-app.log
。