我们需要计算具有大量数据的多租户多节点集群中许多目录中的文件数。 所以,我想知道命令" hdfs dfs -count / path / to / directory" 得到它的信息?它是否像hdfs dfs -ls一样工作?或者直接从HDFS中的Namenode获取其信息?
非常感谢!
答案 0 :(得分:2)
它从FileSystem API调用getContentSummary
方法:
ContentSummary summary = src.fs.getContentSummary(src.path);
out.println(summary.toString(showQuotas) + src);
的源代码
的源代码