我是Apache Hadoop的新手。我遇到了一些德比。 Metadata DB Derby是什么意思?我听说它是一些文件系统。但任何人都可以告诉它究竟是什么&它的工作?
答案 0 :(得分:0)
Hadoop的Namenode存储有关文件在HDFS上的存储位置的元数据。也就是说,当您将文件放到HDFS上时,它会被复制3次(默认情况下),并且Namenode会跟踪哪3台服务器正在托管该文件。
Hive的元数据与Namenode的元数据分开。 Hive的元数据维护其底层分区,表格,数据库等的位置。表格模式也存储在Hive的元数据中。 Hive需要一个数据库后端来维护这个元数据,Derby只是Hive的默认嵌入式Metastore。
参见http://hortonworks.com/blog/hdfs-metadata-directories-explained/ 和https://cwiki.apache.org/confluence/display/Hive/AdminManual+MetastoreAdmin