为什么需要对配置单元表进行存储以支持ACID事务?

时间:2019-02-20 11:15:29

标签: hive acid

我想知道为什么需要对配置单元表进行存储以支持ACID事务。这只是一个蜂巢怪癖吗?还是背后有原因?

1 个答案:

答案 0 :(得分:0)

关于蜂巢的压实机的事情:

  

压缩器运行后台MapReduce作业以压缩增量和   基本文件。压缩有两种类型:主要和次要。的   次要压缩将许多小增量文件合并为一个大增量   文件。主要压缩更加昂贵,它需要增量文件和   将它们与基本文件合并。所有合并都是通过创建一个新的   文件并删除旧的文件。有一个特殊的清洁过程   这样做。 对每个铲斗分别进行压实。基础和   每个存储区都会创建增量文件。

更多内容:https://cwiki.apache.org/confluence/display/Hive/Hive+Transactions

因此,铲斗越多,压实速度就越快。