Hive更新效率(版本0.14)

时间:2015-04-23 07:01:03

标签: hadoop hive

Hive如何有效地处理未分区的列的更新?

假设我想更新特定transactionid(未分区)的行,Hive将如何在内部处理它。根据我的理解,Hive将首先搜索这个(这很慢),然后更新存储包含此transactionid的特定行的特定分区(如果有的话)。 即使这会为用户提供更新数据的抽象,但执行大量更新真的很有效吗?

1 个答案:

答案 0 :(得分:0)

由于hadoop是为大数据处理而设计的,因此在hadoop中行级更新可能效率不高。但是,从Hive版本0.14支持支持ACID的Hive表上的行级更新。有关如何实现行级更新的更多详细信息,请查看Hive教程。 https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DML#LanguageManualDML-Update