如何在配置单元中安排多个分区?

时间:2017-06-02 06:13:13

标签: hadoop hive partitioning hadoop-partitioning

说我有一个订单表,其中包含多个时间列(spend_time,expire_time,withdraw_time), 通常,我会独立查询上面的列,所以如何创建分区?

order_no | spend_time   | expire_time   | withdraw_time | spend_amount  
A001     | 2017/5/1     | 2017/6/1      | 2017/6/2      | 100   
A002     | 2017/4/1     | 2017/4/19     | 2017/4/25     | 500   
A003     | 2017/3/1     | 2017/3/19     | 2017/3/25     | 1000  

通常业务情况是计算某些花费时间或expire_time或withdraw_time之间的总花费数量,或3的组合。

但是有3个时间维度的交叉组合(每个有大约1000个分区)可以有很多分区(1000 * 1000 * 1000),这样可以有效吗?

我的解决方案是我用3个不同的列创建3个表。这是解决这个问题的有效方法吗?

0 个答案:

没有答案