我有一个源文件夹,其中许多文件都有不同的名称:
20160311_TXT_XPL_SLA_Attribution
20160301_TXT_APL_SLA_Attribution
20160301_TXT_XPL_SLA_Attribution
20160302_TXT_APL_SLA_Attribution
我必须根据TXT _ *** _ SLA之间的字母对文件进行排序。
我编写了Perl脚本,但这没有正确排序:
#!/usr/bin/perl
$dir = "E://Unix";
my $file;
my @files;
opendir (DIR, "$dir");
while ($file = readdir(DIR))
{
push (@files, $file);
}
print
map { $_->[1] }
sort
map { /TXT(.*)SLA/; [$1, $_] }
@files;
foreach $file (@files)
{
print "$file\n";
}
closedir(DIR);
即使我在删除下划线后检查了但是没有看到排序模式的任何变化。我对Perl& amp;如果有人能告诉我哪里出错了会很有帮助吗?
输出即将来临:
20160301_TXT_APL_SLA_Attribution.txt
20160301_TXT_XPL_SLA_Attribution.txt
20160302_TXT_APL_SLA_Attribution.txt
20160311_TXT_XPL_SLA_Attribution.txt
预期是:
20160301_TXT_APL_SLA_Attribution.txt
20160302_TXT_APL_SLA_Attribution.txt
20160301_TXT_XPL_SLA_Attribution.txt
20160311_TXT_XPL_SLA_Attribution.txt
使用正则表达式:
/(TXT)(.*)(SLA)/
答案 0 :(得分:4)
这里有两个问题:
print
map { $_->[1] }
sort
map { /TXT(.*)SLA/; [$1, $_] }
@files;
首先,您的Schwartzian Transform缺少排序功能。因此,它会对像ARRAY(0x7ff730805468)
这样的数组引用的字符串版本进行排序。您需要添加sort { $a->[0] cmp $b->[0] }
。
其次,排序不会发生。必须将输出分配回@files
。
答案 1 :(得分:2)
Schwartzian变换仅在数据集很大或排序函数复杂而缓慢时才是有用的优化;否则它只会导致代码不清楚。因此,当有人想要通过数据的功能而不是数据本身进行排序时,它已成为首选模式,这是一种遗憾
有几种选择,您可能更喜欢这样的标准排序功能。 $a
和$b
的相关部分分别被提取到$aa
和$bb
,然后简单地进行比较
use strict;
use warnings 'all';
use feature 'say';
chomp( my @data = <DATA> );
say for sort {
my ($aa, $bb) = map { /TXT_([A-Z]+)_SLA/ } $a, $b;
$aa cmp $bb;
} @data;
__DATA__
20160311_TXT_XPL_SLA_Attribution
20160301_TXT_APL_SLA_Attribution
20160301_TXT_XPL_SLA_Attribution
20160302_TXT_APL_SLA_Attribution
20160301_TXT_APL_SLA_Attribution
20160302_TXT_APL_SLA_Attribution
20160311_TXT_XPL_SLA_Attribution
20160301_TXT_XPL_SLA_Attribution
答案 2 :(得分:1)
来自sort
的文档:
如果省略SUBNAME或BLOCK,则按标准字符串比较顺序排序。
以下代码
sort
map { /TXT(.*)PLA/; [$1, $_] }
@files;
将map
返回的arrayref值按其字符串化值(类似ARRAY(0x22bcd48)
)进行排序。以下内容应按其第一个元素对arrayrefs进行排序:
sort { $a->[0] cmp $b->[0] }
map { /TXT(.*)PLA/; [$1, $_] }
@files;