在Hive中使用分区列是非原始列(日期)有缺点吗?

时间:2016-11-07 16:25:08

标签: date hadoop hive partition

我是否有任何理由不使用格式为date的列作为Apache Hive表中的分区列?

官方文件说:

  

虽然目前对分区列的数据类型没有限制,但允许非原始列分区列可能没有意义。动态分区列的类型应该从表达式派生。必须能够将数据类型转换为字符串,以便在HDFS中保存为目录名。

https://cwiki.apache.org/confluence/display/Hive/DynamicPartitions#DynamicPartitions-Designissues

我不明白为什么格式化为date的列会产生任何问题,因为根据设计,这些列可以转换为string

0 个答案:

没有答案