我的配置单元表中有按日期划分的数据。由于一天的数据量很大,因此我想将此数据进一步分为4部分。所以我想阅读每个部分并处理数据。
要将一天的数据分成4个部分,我们可以在同一日期字段中使用存储桶,并给4个存储桶以4个部分吗?
create table state_part(District string,Enrolments string) PARTITIONED BY(enrolled_date string) CLUSTERED BY (enrolled_date) into 4 buckets;
我是蜂巢的新手,有人可以帮助我将这一天的数据分为4部分,然后一次读取一部分数据。
非常感谢您的帮助。
谢谢, 巴布