我想知道为什么需要对配置单元表进行存储以支持ACID事务。这只是一个蜂巢怪癖吗?还是背后有原因?
答案 0 :(得分:0)
关于蜂巢的压实机的事情:
压缩器运行后台MapReduce作业以压缩增量和 基本文件。压缩有两种类型:主要和次要。的 次要压缩将许多小增量文件合并为一个大增量 文件。主要压缩更加昂贵,它需要增量文件和 将它们与基本文件合并。所有合并都是通过创建一个新的 文件并删除旧的文件。有一个特殊的清洁过程 这样做。 对每个铲斗分别进行压实。基础和 每个存储区都会创建增量文件。
更多内容:https://cwiki.apache.org/confluence/display/Hive/Hive+Transactions
因此,铲斗越多,压实速度就越快。