NiFi moveHDFS处理器似乎无能为力

时间:2018-05-04 01:03:32

标签: hdfs apache-nifi

只需尝试自动将文件从一个HDFS目录移动到另一个HDFS目录。使用Apache NiFi中的moveHDFS处理器执行此操作,但在启动处理器时似乎没有任何事情发生。

经过很长时间后,处理器指标保持为零 enter image description here 并且查看公告板显示没有错误(日志记录级别设置为INFO),公告板中唯一的日志记录输出是:

14:50:04 HSTINFO1e637d0d-0163-1000-7bde-a7993ae403e8
MoveHDFS[id=1e637d0d-0163-1000-7bde-a7993ae403e8] Initialized a new HDFS File System with working dir: file:/home/mapr/nifi-1.6.0 default block size: 33554432 default replication: 1 config: Configuration: core-default.xml, core-site.xml, mapred-default.xml, mapred-site.xml, yarn-default.xml, yarn-site.xml, hdfs-default.xml, hdfs-site.xml, /opt/mapr/hadoop/hadoop-2.7.0/etc/hadoop/core-site.xml, /opt/mapr/hadoop/hadoop-2.7.0/etc/hadoop/hdfs-site.xml

(顺便说一句,为什么会说“初始化一个新的HDFS文件系统”?它不应该使用提供的hadoop配置文件来访问hadoop集群上的现有HDFS吗?)。将NiFi作为单个实例安装在hadoop集群节点上,并根据需要将core-和hdfs-site.xml文件添加到处理器属性中。之前从未使用过NiFi,并怀疑我在这里错过了一些关于正确配置流程的明显信息。关于这里发生了什么以及如何解决它的任何建议将不胜感激。感谢。

1 个答案:

答案 0 :(得分:1)

如果您可以分享更多的流量,那将会有所帮助。 MoveHDFS处理器需要传入的流文件才能处理它们,因此无论处理器生成或接收流文件,都需要将它们传递给该处理器。队列是否显示任何排队的流文件?处理器显示在过去五分钟内没有读入流文件。您可以使用ListHDFSGenerateFlowFile来创建此处理器期望的流文件。

如果这不是问题,您还可以检查处理器计划以确保它设置为频繁运行(它应该是事件驱动的,但如果计时器设置了很长时间并且由于某种原因,可能会导致此行为)。

对于新的HDFS文件系统,您是否在core-site.xml处理器属性中提供了(正确且完整的)hdfs-site.xmlMoveHDFS文件?如果找不到现有文件,则会创建默认文件。 Apache NiFi site提供了完整的文档。