因为"加载本地"命令可以将数据从本地文件系统加载到hive表,我不确定为什么大多数人都想放置HFDS + replaceText + HiveQL。使用" replaceText + HiveQL"并不是更好。只代替添加1个处理器:putHDFS在工作流程中?
答案 0 :(得分:0)
很多时候,NiFi将在Hadoop集群之外的服务器上运行,而Hadoop客户端不存在,所以PutHDFS正在将数据从该服务器传输到HDFS,然后ReplaceText + PutHiveQL是一种创建外部Hive的方法表格位于刚刚登陆HDFS的数据之上。