只需尝试自动将文件从一个HDFS目录移动到另一个HDFS目录。使用Apache NiFi中的moveHDFS处理器执行此操作,但在启动处理器时似乎没有任何事情发生。
经过很长时间后,处理器指标保持为零 并且查看公告板显示没有错误(日志记录级别设置为INFO),公告板中唯一的日志记录输出是:
14:50:04 HSTINFO1e637d0d-0163-1000-7bde-a7993ae403e8
MoveHDFS[id=1e637d0d-0163-1000-7bde-a7993ae403e8] Initialized a new HDFS File System with working dir: file:/home/mapr/nifi-1.6.0 default block size: 33554432 default replication: 1 config: Configuration: core-default.xml, core-site.xml, mapred-default.xml, mapred-site.xml, yarn-default.xml, yarn-site.xml, hdfs-default.xml, hdfs-site.xml, /opt/mapr/hadoop/hadoop-2.7.0/etc/hadoop/core-site.xml, /opt/mapr/hadoop/hadoop-2.7.0/etc/hadoop/hdfs-site.xml
(顺便说一句,为什么会说“初始化一个新的HDFS文件系统”?它不应该使用提供的hadoop配置文件来访问hadoop集群上的现有HDFS吗?)。将NiFi作为单个实例安装在hadoop集群节点上,并根据需要将core-和hdfs-site.xml文件添加到处理器属性中。之前从未使用过NiFi,并怀疑我在这里错过了一些关于正确配置流程的明显信息。关于这里发生了什么以及如何解决它的任何建议将不胜感激。感谢。
答案 0 :(得分:1)
如果您可以分享更多的流量,那将会有所帮助。 MoveHDFS
处理器需要传入的流文件才能处理它们,因此无论处理器生成或接收流文件,都需要将它们传递给该处理器。队列是否显示任何排队的流文件?处理器显示在过去五分钟内没有读入流文件。您可以使用ListHDFS
或GenerateFlowFile
来创建此处理器期望的流文件。
如果这不是问题,您还可以检查处理器计划以确保它设置为频繁运行(它应该是事件驱动的,但如果计时器设置了很长时间并且由于某种原因,可能会导致此行为)。
对于新的HDFS文件系统,您是否在core-site.xml
处理器属性中提供了(正确且完整的)hdfs-site.xml
和MoveHDFS
文件?如果找不到现有文件,则会创建默认文件。 Apache NiFi site提供了完整的文档。