Hive数据存储在哪里?

时间:2017-04-27 12:06:14

标签: hive

我对hive存储数据的位置感到有些困惑。

它是将数据存储在HDFS还是RDBMS中? Hive Meta商店是否使用RDBMS来存储hive表元数据?

先谢谢!!

2 个答案:

答案 0 :(得分:1)

Hive数据存储在Hadoop compatible filesystems:S3,HDFS或其他兼容文件系统之一中。

Hive元数据存储在像MySQL这样的RDBMS中。

可以为托管表和外部表指定Hive表数据在S3或HDFS中的位置。

托管表和外部表之间的区别在于托管表中的DROP TABLE语句将删除表并删除表的数据。然而,对于外部表DROP TABLE,将只删除表,数据将保持原样,并可用于在其上创建其他表。

请在此处查看详细信息:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL#LanguageManualDDL-CreateTableCreate/Drop/TruncateTable

答案 1 :(得分:0)

以下是您问题的答案。但我建议你阅读蜂巢书或apache蜂巢网站,以便更好地理解。

它是将数据存储在HDFS还是RDBMS中? - HIVE数据始终存储在HDFS中。对于托管表,默认情况下,数据存储在hive仓库中,这是HDFS中的目录。对于HIVE外部表用户可以在HDFS中的任何位置指定位置。

Hive Meta Store是否使用RDBMS来存储hive表元数据? - 是的,HIVE使用RDBMS存储元数据。