在Hive表的同一列上进行分区和存储

时间:2019-10-25 21:01:57

标签: hive

我的配置单元表中有按日期划分的数据。由于一天的数据量很大,因此我想将此数据进一步分为4部分。所以我想阅读每个部分并处理数据。

要将一天的数据分成4个部分,我们可以在同一日期字段中使用存储桶,并给4个存储桶以4个部分吗?

create table state_part(District string,Enrolments string) PARTITIONED BY(enrolled_date string) CLUSTERED BY (enrolled_date) into 4 buckets;

我是蜂巢的新手,有人可以帮助我将这一天的数据分为4部分,然后一次读取一部分数据。

非常感谢您的帮助。

谢谢, 巴布

0 个答案:

没有答案