作为hadoop的初学者,我对这些单词命名空间和元数据感到困惑。这两者之间有什么关系吗?
答案 0 :(得分:8)
根据' Hadoop权威指南' - " NameNode管理文件系统命名空间。它维护文件系统树以及树中所有文件和目录的元数据。"
基本上,命名空间表示容器。在此上下文中,它表示文件名分组或层次结构。
元数据包含文件所有者,权限位,块位置,大小等内容。
答案 1 :(得分:0)
命名空间不过是我们用来描述文件系统的树状结构的术语。
基本上,当我们说名称空间时,是指在hdfs上的某个位置。
“ /”或“ root”目录是名称空间。文件夹/ user是一个名称空间。在Hadoop中,我们将命名空间称为由NameNode处理的目录。
答案 2 :(得分:0)
为了使事情更容易/更清晰,并且由于HDFS是另一个文件系统,我们可以举一个Windows文件系统的示例:
假设您在此路径 C:\ User \ Test \ New Folder \ Test.txt 中有一个文件: test.txt 。
因此,对于Windows,此路径为命名空间。
现在,如果转到该文件的属性,您将找到一些信息(创建日期,最后修改,所有者...)
这些信息就是元数据,之所以这样称呼,是因为它代表了更高的抽象级别(数据是文件的内容,而元数据是文件本身的描述)。
同样,我们可以为HDFS使用相同的示例,因此,命名空间是访问数据块的路径,而元数据是有关该块的信息自我