我有点惊讶地知道Hive现在有UPDATE语句(虽然它看起来像是从v0.14回来),虽然我很清楚一段时间它是在Hive的路线图中拥有完整或接近RDBMS-SQL的功能。
您能否总结一下Hive的INSERT,UPDATE,DELETE与关系数据库的不同之处及其局限性(Hive在撰写本文时是v2.1.0)?
Hive是否应该继续改进其类似RDBMS的SQL功能,比如说2 - 3年的时间,它是否会对Relational DB工作负载有用?
(我不知道完整的路线图。请原谅,如果这是一个愚蠢的问题,或者是因浏览文档而导致的懒惰问题。)
答案 0 :(得分:0)
Hive支持插入。但是对于更新和删除操作,以下是要求 仅适用于ORC格式 仅适用于分段表 必须指定TBLPROPERTIES(" transactional" =" true")
延迟仍然是此操作的一个问题,下面介绍了为什么会引入ACID兼容性的用例。但是在路线图中,配置单元并不打算替换事务关系数据库。
https://cwiki.apache.org/confluence/display/Hive/Hive+Transactions#HiveTransactions-Limitations