蜂巢中动态和静态分区的最佳实践是什么?

时间:2016-04-24 17:57:05

标签: hadoop apache-spark hive bigdata

配置单元中的分区最合适的用例是什么?在我的情况下,我在逻辑上将数据与日期分成什么是最佳分区类型? 帮助我...

1 个答案:

答案 0 :(得分:0)

这是一个很好的案例。根据我的个人经验,处理大约10亿条记录,分区年份和分区月份的表格看起来效果最好。你也可以在那里度过一天。这取决于你对它的使用。一个分区很好的表可以将一个30分钟的工作减少到一个5分钟的工作:)