我正在使用此命令来获取小于17MB的文件:
hadoop fsck /admin_test -files |
gawk '{if ($2 ~ /^[0-9]+$/ && $2 <= 17825792) print $1,$2;}'
如何获得小于17MB的所有文件的总大小?
答案 0 :(得分:3)
gawk '
$2 ~ /^[0-9]+$/ && $2 <= 17825792 {sum += $2; print $1, $2}
END {print "sum=", 0+sum}
'
答案 1 :(得分:1)
如何将du
与--threshold=SIZE
arg:
-t, --threshold=SIZE
exclude entries smaller than SIZE if positive, or entries greater than SIZE if negative
类似的东西:
du -sk --threshold=-17825792 /admin_test