来自边缘节点的hive insert
查询是否有任何不利之处,无法从oozie工作流程运行它?
Oozie docs表示,通过oozie运行会将工作负载分配给可用的数据节点。
但是我认为通过边缘节点运行仍然应该调用作业跟踪器并在集群上运行?
答案 0 :(得分:1)
当您从边缘节点运行Hive命令时,它会接受该命令,创建机器生成的MapReduce代码(在大多数情况下),并将其发送到集群,在集群中,它被视为使用尽可能多的MapReduce作业根据需要的数据节点。 Oozie会做同样的事情。无论哪种方式。
所以你的假设是正确的。