标签: sql hive query-optimization
使用Map Reduce范例(通过TEZ或MR),我认为估计HIVE查询复杂性非常复杂,特别是当它由许多连接组成时(LEFT和INNER)。
虽然MySQL或ORACLE中的解释非常明确地指出了一个索引或关键用途的湖泊,但是Hive中的解释更加阴霾。
有些查询涉及大量的CPU /内存占用并占用大量时间,我很难找到这些点,当同一查询一天需要600秒而第二天需要120秒时,它会变得疯狂:)< / p>
非常感谢帮助和建议以及XP共享!