任何人都可以解释我/给我一个链接reg。那,什么是高级聚合? 我读了一些设置属性的地方
hive.map.aggr = true
执行高级别聚合。但我找不到它的含义!
答案 0 :(得分:1)
hive.map.aggr控制我们如何进行聚合。默认值为false。如果设置为true,Hive将直接在map任务中执行第一级聚合。 这通常可以提高效率,但可能需要更多内存才能成功运行。
进一步讨论: http://dev.bizo.com/2013/02/map-side-aggregations-in-apache-hive.html
答案 1 :(得分:-1)
答案在HIVE Programming,第86页.GL!