hadoop - Hive更新效率（版本0.14） - Thinbug

Hive更新效率（版本0.14）

时间：2015-04-23 07:01:03

标签： hadoop hive

Hive如何有效地处理未分区的列的更新？

假设我想更新特定transactionid（未分区）的行，Hive将如何在内部处理它。根据我的理解，Hive将首先搜索这个（这很慢），然后更新存储包含此transactionid的特定行的特定分区（如果有的话）。即使这会为用户提供更新数据的抽象，但执行大量更新真的很有效吗？

1 个答案:

答案 0 :(得分：0)

由于hadoop是为大数据处理而设计的，因此在hadoop中行级更新可能效率不高。但是，从Hive版本0.14支持支持ACID的Hive表上的行级更新。有关如何实现行级更新的更多详细信息，请查看Hive教程。 https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DML#LanguageManualDML-Update