标签: hadoop hive
我是Hive的新手。我几乎没有怀疑。
我想知道Hive如何将查询转换为MapReduce作业?
我看了解命令,它给了我一个舞台计划和 依赖。我想知道阶段的细节。这些阶段如何 定义了吗?
如何控制MapReduce执行。假设我想改变 减少连接到地图侧连接。
答案 0 :(得分:3)
在抽象级别,在hive中执行查询时会发生以下情况
我希望这能回答您的问题1和2.您可以从here
对于问题3,我相信如果可能,配置单元将自动进行地图端连接。检查HIVE-3784 在此之前,您必须在hive查询中提供提示以执行mapside join。见link
要详细了解联接在联配中如何工作,请参阅此link