Bash filesname模式检测和更正

时间:2016-02-02 10:51:56

标签: regex bash pattern-matching

我正在寻找用于检测多个文件中的模式的工具,目的是纠正任何异质性。准确地说,这个工具将有助于生成重命名方案。 正确的模式可以是固定模式和增量的混合,然后是任何一个,然后是授权的扩展。

文件数量范围从10 000到100 000,解决方案应旨在最大限度地减少用户干预。

我有一个这样的目录:

  testDir/
├── corrupttestfile100.ext
├── testfil0000.ext
├── testfil0001.ext
├── testfil0002.ext
├── testfil0003.ext
├── testfil0004.ext
├── testfil0005.ext
├── testfil0006.ext
├── testfil0007.ext
├── testfil0008.ext
├── testfil0009.ext
├── testfile010.ext
├── testfile011.ext
├── testfile012.ext
├── testfile013.ext
├── testfile014.ext
├── testfile015.ext
├── testfile016.ext
├── testfile017.ext
├── testfile018.ext
├── testfile019.ext
├── testfile020.ext
├── testfile021.ext
├── testfile022.ext
├── testfile023.ext
├── testfile024.ext
├── testfile025.ext
├── testfile026.ext
├── testfile027.ext
├── testfile028.ext
├── testfile029.ext
├── testfile030.ext
├── testfile031.ext
├── testfile032.ext
├── testfile033.ext
├── testfile034.ext
├── testfile035.ext
├── testfile036.ext
├── testfile037.ext
├── testfile038.ext
├── testfile039.ext
├── testfile040.ext
├── testfile041.ext
├── testfile042.ext
├── testfile043.ext
├── testfile044.ext
├── testfile045.ext
├── testfile046.ext
├── testfile047.ext
├── testfile048.ext
├── testfile049.ext
├── testfile050.ext
├── testfile051.ext
├── testfile052.ext
├── testfile053.ext
├── testfile054.ext
├── testfile055.ext
├── testfile056.ext
├── testfile057.ext
├── testfile058.ext
├── testfile059.ext
├── testfile060.ext
├── testfile061.ext
├── testfile062.ext
├── testfile063.ext
├── testfile064.ext
├── testfile065.ext
├── testfile066.ext
├── testfile067.ext
├── testfile068.ext
├── testfile069.ext
├── testfile080.ext
├── testfile081.ext
├── testfile082.ext
├── testfile083.ext
├── testfile084.ext
├── testfile085.ext
├── testfile086.ext
├── testfile087.ext
├── testfile088.ext
├── testfile089.ext
├── testfile090.ext
├── testfile091.ext
├── testfile092.ext
├── testfile093.ext
├── testfile094.ext
├── testfile095.ext
├── testfile096.ext
├── testfile097.ext
├── testfile098.ext
├── testfile099.ext
├── testfile101.ext2
└── testfileNotRelevant.ext

我希望有足够的工具来提供以下反馈或同等信息:

  1. pattern ^testfil matching 92/93

        Exception : 
        corrupttestfile100.ext

  2. pattern ^testfile matching 82/93

        Exception :
        corrupttestfile100.ext
        testfil0000.ext
        testfil0001.ext
        testfil0002.ext
        testfil0003.ext
        testfil0004.ext
        testfil0005.ext
        testfil0006.ext
        testfil0007.ext
        testfil0008.ext
        testfil0009.ext

 3. Increment pattern breaks [70-79]
 4. Increment pattern 3 digits 92/93
 5. Increment pattern 4 digits 10/93
 6. Extension exception : ext2 1/93

我开始用bash使用grep,find,sed和rename编写脚本,因为它看起来很自然,但我想知道是否会碰到一些墙壁,如果我重新发明轮子。我似乎没有找到任何相关的帮助来源,类似的现有工具不是开源的,也不是数据不可知的。

0 个答案:

没有答案