标签: hadoop apache-spark hive bigdata
配置单元中的分区最合适的用例是什么?在我的情况下,我在逻辑上将数据与日期分成什么是最佳分区类型? 帮助我...
答案 0 :(得分:0)
这是一个很好的案例。根据我的个人经验,处理大约10亿条记录,分区年份和分区月份的表格看起来效果最好。你也可以在那里度过一天。这取决于你对它的使用。一个分区很好的表可以将一个30分钟的工作减少到一个5分钟的工作:)