作为oozie工作流程的一部分,我正在尝试查找hdfs目录的总累积大小(该目录包含存在文件的子目录)。我尝试使用fs:dirSize函数作为oozie操作的一部分,但是即使子目录中存在文件,该函数也将size返回为0。
根据oozie文档,fs:dirSize(String path)不能递归工作,仅计算指定路径下文件的大小。请告知如何获取考虑子目录中文件的累积大小。
<?xml version="1.0" encoding="UTF-8"?>
<workflow-app xmlns="uri:oozie:workflow:0.5" name="sample_WF">
<start to="decisionCheck"/>
<decision name="decisionCheck">
<switch>
<case to="end">
${fs:dirSize('/tmp/testOozie') gt 0}
</case>
<default to="fail"/>
</switch>
</decision>
<kill name="fail">
<message>***Failed***</message>
</kill>
<end name="end" />
</workflow-app>