如何在文件夹层次结构中找到所有不同的贪婪文件后缀?

时间:2018-03-01 11:49:15

标签: linux bash ubuntu-14.04

我在这里找到了一个相关的问题:

How can I find all of the distinct file extensions in a folder hierarchy?

但我的情况略有不同。在Ubuntu 14.04 Linux上使用bash,如果我有一堆类似下面的文件:

result = [hex(ord(x))[2:] for x in list_input]

我想知道从找到的第一个分隔符中获得的每个扩展名的文件数量(例如,示例中为ls -1 | sort -V fileA.foo.bar.txt.gz fileA.foo.foo.txt.gz fileA.xyz.bar.txt.gz fileB.foo.bar.txt.gz fileB.foo.foo.txt.gz fileB.xyz.bar.txt.gz )。所以它会是:

\.

这不是我在上述问题中找到的最佳答案:

2 .foo.bar.txt.gz
2 .foo.foo.txt.gz
2 .xyz.bar.txt.gz

2 个答案:

答案 0 :(得分:2)

cwd中文件的所有bash解决方案:

declare -A a         # declare an associative array a
for f in *.*         # loop all filenames with a .
do 
  ((a[${f#*.}]++))   # increment array elements value
done

输出计数:

for k in "${!a[@]}"  # loop all array keys
do 
  echo ${a[$k]} $k   # output value and key
done
1 zip
2 txt
1 txt~

答案 1 :(得分:0)

您可以摆脱sedperl并使用cut,尝试使用:

find . -type f  | cut -d. -f3- | sort | uniq -c