具有中间列的Impala动态分区

时间:2019-03-12 17:41:25

标签: hadoop hive impala hadoop-streaming

我有一个要求,我想用HDFS上现有文件中的分区创建一个表。 Oracle金门复制文件并将其加载到HDFS中。我需要在其上进行分区的日期值(DATE_TIME_DATE)在文件中可用,但日期值列的位置不是最后一个,位于中间。以我的理解,Impala分区列应该是序列顺序中的最后一个。例如:

表格内容: ASCII字符串, ASCII_VAR STRING, DATE_TIME_DATE STRING, TIMESTAMP_WITH STRING, TIMESTAMP_WITH_TZ STRING

如何为它创建表分区?

0 个答案:

没有答案