我在HDFS中有一堆tsv文件,其目录结构遵循分区约定,其中event_dt
是分区。
some_path/event_dt=2017-04-30
some_path/event_dt=2017-05-01
等等。
问题是event_dt也是其中一列。特别是第二个。但我无法指定,因为event_dt
不能出现在表模式和PARTITIONED BY
语句中。这触发了:
Column repeated in partitioning columns
除了使用不同的名称之外,还有其他办法吗?毕竟,这是相同的信息。
答案 0 :(得分:-1)
3个选项。