Hive上的非分区表是否有任何优点 - 与分区表相比它们的特殊用例?
如果有人能提供帮助,那就太棒了。 :)
答案 0 :(得分:3)
让我们这样说:在数据库世界中,分区可以用来解决不同类型的问题。只要你没有明确的问题,不要打扰分区(即"如果它没有被破坏,就不要修复它") 。无论何时遇到问题,请让DB架构师找到解决方案 - 可能涉及分区,也许不会。
但是Hive不是典型的数据库。分区无处不在,只是因为它缺乏索引是一个粗略的解决方法......
(嗯,实际上ORC格式有自己的解决方法[存储每个条带的每列最小/最大值,这允许跳过无用条纹]因此分区对于该格式不那么重要)