BASH:使用md5sum处理重复项

时间:2013-10-27 23:46:27

标签: arrays bash duplicates md5 md5sum

我设法在我的目录中找到重复项时将哈希与文件路径分开。我的下一个任务是仅打印重复项(例如:3个文件,2个重复项)。

到目前为止我所做的是将输出放在这样的数组中:

arr=( $(find $1 -type f -print0 | xargs -0 md5sum | sort | uniq -w32 --all-repeated=separate) )

我需要计算每个文件(不是原始文件)的重复数量,获取每个文件的大小并分别列出它们的路径。

我尝试在我的arr中执行for循环,但我无法比较哈希值,它会给我value too great for base错误。

任何提示都会很棒。

已解决

for ((i = 0 ; i < ${#arr[@]} ; i++ ))
do 
//...compare here
done

1 个答案:

答案 0 :(得分:0)

这是循环的解决方案:

for ((i=0 ; i<${#arr[@]} ; i++ ))
do 
//...compare here
done

确保在初始化'i'并比较它时保留空格..