我是否有任何理由不使用格式为date
的列作为Apache Hive表中的分区列?
官方文件说:
虽然目前对分区列的数据类型没有限制,但允许非原始列分区列可能没有意义。动态分区列的类型应该从表达式派生。必须能够将数据类型转换为字符串,以便在HDFS中保存为目录名。
https://cwiki.apache.org/confluence/display/Hive/DynamicPartitions#DynamicPartitions-Designissues
我不明白为什么格式化为date
的列会产生任何问题,因为根据设计,这些列可以转换为string
。