据我所知,hdfs将其文件存储为数据节点上的块,每个块实际上都存储为每个数据节点的本地文件系统中的文件。
所以我想知道是否有办法在本地文件系统中获取hdfs块的实际文件名,假定hdfs文件名。
感谢。
答案 0 :(得分:3)
您可以在您考虑的文件上使用Hadoop的FSCK命令。这将返回主机和块名称。但是,它不提供本地文件系统上文件的完整路径。
$ hadoop fsck /path/to/file -files -blocks -locations
另一种选择是通过HDFS WebUI。如果浏览到每个文件,它将列出块名称和主机。