如何在目录下递归获取所有文件的总大小

时间:2016-01-14 19:16:40

标签: linux hadoop awk hdfs

我正在使用此命令来获取小于17MB的文件:

hadoop fsck /admin_test -files | 
gawk '{if ($2 ~ /^[0-9]+$/ && $2 <= 17825792) print $1,$2;}'

如何获得小于17MB的所有文件的总大小?

2 个答案:

答案 0 :(得分:3)

gawk '
    $2 ~ /^[0-9]+$/ && $2 <= 17825792 {sum += $2; print $1, $2} 
    END {print "sum=", 0+sum}
'

答案 1 :(得分:1)

如何将du--threshold=SIZE arg:

一起使用呢?
       -t, --threshold=SIZE
          exclude entries smaller than SIZE if positive, or entries greater than SIZE if negative

类似的东西:

du -sk --threshold=-17825792 /admin_test