如何了解hdfs -du结果

时间:2018-09-18 01:39:24

标签: hadoop filesystems

我正在尝试使用命令hdfs dfs - du -h列出文件和文件夹的大小。 我使用的命令是hdfs dfs - du -h /path_name/folder_name,返回的结果就像

9.2 G   27.5 G  /path_name/folder_name/xxx01.parquet
0       0       /path_name/folder_name/xxx02.parquet
19.9 M  59.6 M  /path_name/folder_name/xxx03.parquet

我知道hadoop命令行从通用文件系统命令中借来了很多东西,-du -h列出了人类可读的文件夹/文件大小。但是,(以第一条结果行为例)这两个数字9.2 G 27.5 G分别是什么意思?

谢谢!

1 个答案:

答案 0 :(得分:0)

您的群集复制因子是3。第一个数字是文件的纯大小,第二个数字是带有副本的文件大小。例如,实际文件大小为9.2 GB。由于复制因子为3,因此具有副本的文件大小为27.5GB

size      disk space consumed with all replicas full_path