使用perl根据名称对文件进行排序

时间:2016-03-11 21:35:06

标签: regex perl

我有一个源文件夹,其中许多文件都有不同的名称:

20160311_TXT_XPL_SLA_Attribution

20160301_TXT_APL_SLA_Attribution

20160301_TXT_XPL_SLA_Attribution

20160302_TXT_APL_SLA_Attribution

我必须根据TXT _ *** _ SLA之间的字母对文件进行排序。

我编写了Perl脚本,但这没有正确排序:

    #!/usr/bin/perl

    $dir = "E://Unix";
    my $file;
    my @files;
    opendir (DIR, "$dir");
    while ($file = readdir(DIR)) 
    {
      push (@files, $file);
    }


    print 
         map  { $_->[1] } 
         sort 
         map  { /TXT(.*)SLA/; [$1, $_] }
         @files;

   foreach $file (@files) 
   {
     print "$file\n";
   }

   closedir(DIR);

即使我在删除下划线后检查了但是没有看到排序模式的任何变化。我对Perl& amp;如果有人能告诉我哪里出错了会很有帮助吗?

输出即将来临:

20160301_TXT_APL_SLA_Attribution.txt

20160301_TXT_XPL_SLA_Attribution.txt

20160302_TXT_APL_SLA_Attribution.txt

20160311_TXT_XPL_SLA_Attribution.txt

预期是:

20160301_TXT_APL_SLA_Attribution.txt

20160302_TXT_APL_SLA_Attribution.txt

20160301_TXT_XPL_SLA_Attribution.txt

20160311_TXT_XPL_SLA_Attribution.txt

使用正则表达式:

/(TXT)(.*)(SLA)/

3 个答案:

答案 0 :(得分:4)

这里有两个问题:

print 
     map  { $_->[1] } 
     sort 
     map  { /TXT(.*)SLA/; [$1, $_] }
     @files;

首先,您的Schwartzian Transform缺少排序功能。因此,它会对像ARRAY(0x7ff730805468)这样的数组引用的字符串版本进行排序。您需要添加sort { $a->[0] cmp $b->[0] }

之类的内容

其次,排序不会发生。必须将输出分配回@files

答案 1 :(得分:2)

Schwartzian变换仅在数据集很大或排序函数复杂而缓慢时才是有用的优化;否则它只会导致代码不清楚。因此,当有人想要通过数据的功能而不是数据本身进行排序时,它已成为首选模式,这是一种遗憾

有几种选择,您可能更喜欢这样的标准排序功能。 $a$b的相关部分分别被提取到$aa$bb,然后简单地进行比较

use strict;
use warnings 'all';
use feature 'say';

chomp( my @data = <DATA> );

say for sort {
    my ($aa, $bb) = map { /TXT_([A-Z]+)_SLA/ } $a, $b;
    $aa cmp $bb;
} @data;

__DATA__
20160311_TXT_XPL_SLA_Attribution
20160301_TXT_APL_SLA_Attribution
20160301_TXT_XPL_SLA_Attribution
20160302_TXT_APL_SLA_Attribution

输出

20160301_TXT_APL_SLA_Attribution
20160302_TXT_APL_SLA_Attribution
20160311_TXT_XPL_SLA_Attribution
20160301_TXT_XPL_SLA_Attribution

答案 2 :(得分:1)

来自sort的文档:

  

如果省略SUBNAME或BLOCK,则按标准字符串比较顺序排序。

以下代码

 sort 
 map  { /TXT(.*)PLA/; [$1, $_] }
 @files;

map返回的arrayref值按其字符串化值(类似ARRAY(0x22bcd48))进行排序。以下内容应按其第一个元素对arrayrefs进行排序:

 sort { $a->[0] cmp $b->[0] }
 map  { /TXT(.*)PLA/; [$1, $_] }
 @files;