是否可以在多个列上进行存储

时间:2016-04-02 03:05:30

标签: hadoop hive impala

我正在尝试按照日期分区的表中的hive SQL查询中的col1,col2,col3,col4进行分组。该表有365个分区和大约40G的数据。是否建议将数据存储在4列?我的理解是它与增加reducers数量相同。任何想法?

0 个答案:

没有答案