标签: hadoop hive
Hive如何有效地处理未分区的列的更新?
假设我想更新特定transactionid(未分区)的行,Hive将如何在内部处理它。根据我的理解,Hive将首先搜索这个(这很慢),然后更新存储包含此transactionid的特定行的特定分区(如果有的话)。 即使这会为用户提供更新数据的抽象,但执行大量更新真的很有效吗?
答案 0 :(得分:0)