我正在尝试使用命令hdfs dfs - du -h
列出文件和文件夹的大小。
我使用的命令是hdfs dfs - du -h /path_name/folder_name
,返回的结果就像
9.2 G 27.5 G /path_name/folder_name/xxx01.parquet
0 0 /path_name/folder_name/xxx02.parquet
19.9 M 59.6 M /path_name/folder_name/xxx03.parquet
我知道hadoop命令行从通用文件系统命令中借来了很多东西,-du -h
列出了人类可读的文件夹/文件大小。但是,(以第一条结果行为例)这两个数字9.2 G 27.5 G
分别是什么意思?
谢谢!
答案 0 :(得分:0)
您的群集复制因子是3。第一个数字是文件的纯大小,第二个数字是带有副本的文件大小。例如,实际文件大小为9.2 GB。由于复制因子为3,因此具有副本的文件大小为27.5GB
size disk space consumed with all replicas full_path