标签: hadoop hive impala
我正在尝试按照日期分区的表中的hive SQL查询中的col1,col2,col3,col4进行分组。该表有365个分区和大约40G的数据。是否建议将数据存储在4列?我的理解是它与增加reducers数量相同。任何想法?