在Hive中使用多级分区

时间:2013-02-25 21:42:28

标签: hive partitioning

我想知道以下是否可行。我有Hive中的数据按日期和记录器分区,但我也有不属于特定记录器的数据。

e.g。

date=2012-01-01/logger=1/part000
date=2012-01-01/logger=1/part001
date=2012-01-01/logger=2/part000
date=2012-01-01/logger=2/part001
date=2012-01-01/part000

我创建了我的表:

create table mytable (
    ...
)
partitioned by (date string, logger int)
....
;

并添加了分区:

alter table mytable add partition (date='2012-01-01', logger=1) location '/user/me/date=2012-01-01/logger=1/';
...

我可以查询分区中的数据,但我无法查询文件date=2012-01-01/part000中的数据。是否可以在不符合分区的情况下包含此文件?

谢谢

1 个答案:

答案 0 :(得分:0)

亚伦,你是如何设法获得这样的结构的?通常,如果缺少分区键,HIVE会创建名为 __ HIVE_DEFAULT_PARTITION __ 的分区。