任何人都可以解释分区Hive表的问题。
如果我创建一个表并按日期对其进行分区。在hdfs中,它显示为文件名..或子文件。这是什么意思?
有人可以解释这个概念吗?
答案 0 :(得分:0)
您已经为整个数据集加载了一个分区,即“age equals 22”分区。因此,表中的所有行的年龄都为22岁。
如果在语句中指定分区,它将写入该分区。您可能想要动态分区,您可以在其中创建从某些select语句中提取的分区。
通常,在Hive中进行分区的目的是提高性能并构建表以镜像已知的访问模式和用法 - 例如,我总是按年龄查询我的表。