我刚开始探索Hive。它具有类似于表,连接,分区等RDBMS的所有结构。我所理解的是Hive仍然使用HDFS进行存储,它是HDFS的SQL抽象。由此我不确定天气Hive本身是一个像HBase,Cassnadra这样的数据库解决方案..或者只是它是HDFS之上的查询系统。我不认为它只是一种查询语言,因为它有表,连接和分区..
答案 0 :(得分:39)
Hive是一个建立在Hadoop之上的数据仓库包/基础架构。它提供了一种称为Hive查询语言(HQL)的SQL方言,用于查询存储在Hadoop集群中的数据。与广泛使用的所有SQL方言一样,HQL并不完全符合ANSI SQL标准的任何特定修订版。它可能最接近MySQL的方言,但有很大的差异。 Hive不支持行级插入,更新和删除。 Hive不支持交易。所以我们无法将它与RDBMS进行比较。 Hive添加扩展以在Hadoop环境中提供更好的性能,并与自定义扩展甚至外部程序集成。它非常适合批量处理数据,例如:日志处理,文本挖掘,文档索引,面向客户的商业智能, 预测建模,假设检验等。
Hive不是为在线交易处理而设计的,也不提供实时查询。