我在Hive中读了一个关于分区的article ,其中说“Hive中的分区水平分配执行负载”。
我很好奇水平(而不是垂直)负载分布意味着什么 - 如果这有意义的话。并且可以“垂直”加载?
答案 0 :(得分:0)
在hive中对表进行分区时,表示为同一类数据创建不同的目录。 例如。 你有一个有城市相关细节的数据,你想要一个城市的细节让我们假设浦那。
没有分区: 你将不得不扫描整个表只有pune相关的细节。这意味着垂直整个表。
分区: 如果你已经在城市上创建了分区,那么数据将分布在分区上意味着例如pune相关数据进入pune分区,当你尝试访问与pune相关的数据时,你就不必扫描整个表。