基于范围的Hive分区外部表

时间:2013-07-16 04:39:46

标签: range hive partitioning

我想根据数字范围在hive中对外部表进行分区。假设1到100的数字转到一个分区。是否可以在蜂巢中执行此操作?

1 个答案:

答案 0 :(得分:1)

我假设您有一个表,其中包含一些记录,您希望将数据加载到外部表中,该表由某些字段分区,例如RANGEOFNUMS。

现在,假设我们有一个名为testtable的表,其中包含列名和值。内容如

India,1 
India,2 
India,3 
India,3 
India,4 
India,10 
India,11 
India,12 
India,13 
India,14 

现在,假设我们有一个名为testext的外部表,其中包含一些列以及分区列,例如RANGEOFNUMS。

现在你可以做一件事,

insert into table testext partition(rangeofnums="your value")
select * from testtable where value>=1 and value<=5;

这样,来自testtable的值为1到5的所有记录都将进入外部表的一个分区。

这个场景只是我的假设。如果这不是你的情景,请评论。

Achyut