我可以使用Perl的解压缩将字符串分解为变量吗?

时间:2009-10-07 21:53:54

标签: perl substr unpack

我的图像文件名由四部分组成:

  1. $Directory(图片所在的目录)
  2. $Name(对于艺术网站,这是绘画名称参考#)
  3. $File(图片文件名减去扩展名)
  4. $Extension(图片扩展名)
  5. $example 100020003000.png
    

    我希望相应地分解:

    $dir=1000 $name=2000 $file=3000 $ext=.png
    

    我想知道substr是否是分解传入$example的最佳选择,所以我可以使用4个变量进行处理,例如验证/错误检查,从$Name任务中获取详细名称或随你。我找到了这篇文章:

    is unpack faster than substr? 所以,在我的初学者“石头工具”方法中:

    my $example = "100020003000.png";
    my $dir = substr($example, 0,4);
    my $name = substr($example, 5,4);
    my $file = substr($example, 9,4);
    my $ext = substr($example, 14,3); # will add the the  "." later #
    

    那么,我可以使用解压缩,或者甚至是其他更有效的方法吗?

    我还想避免加载任何模块,除非这样做会因为某些原因使用更少的资源。 Mod是我luv'em的好工具,但我觉得这里没有必要。

    我意识到我应该将vars推入数组/ hash,但是我真的是初学者,我需要进一步指导如何做到这一点以及如何将它们拉回来。

    感谢stackoverflow.com上的所有人!

5 个答案:

答案 0 :(得分:11)

绝对:

my $example = "100020003000.png";
my ($dir, $name, $file, $ext) = unpack 'A4' x 4, $example;

print "$dir\t$name\t$file\t$ext\n";

输出:

1000    2000    3000    .png

答案 1 :(得分:5)

我只是使用正则表达式:

my ($dir, $name, $file, $ext) = $path =~ m:(.*)/(.*)/(.*)\.(.*):;

或者,为了匹配您的具体示例:

my ($dir, $name, $file, $ext) = $example =~ m:^(\d{4})(\d{4})(\d{4})\.(.{3})$:;

答案 2 :(得分:3)

使用unpack是好的,但由于元素的宽度都相同,所以正则表达式也非常简单:

my $example = "100020003000.png";
my ($dir, $name, $file, $ext) = $example =~ /(.{4})/g;

答案 3 :(得分:1)

它不是解压缩,但由于你有4个字符的组,你可以使用有限的分割,捕获:

my ($dir, $name, file, $ext) = grep length, split /(....)/, $filename, 4;

这是非常模糊的,所以我可能不会使用它,但分裂中的捕获是一个被忽略的能力。

所以,这里是对这段代码的解释:

步骤1. split带有捕获括号,将模式捕获的值添加到其输出流中。该流包含字段和分隔符的混合。

qw( a 1 b 2 c 3 ) == split /(\d)/, 'a1b2c3';

步骤2. split有3个args限制字符串被拆分的次数。

qw( a b2c3 ) == split /\d/, 'a1b2c3', 2;

步骤3.现在,当我们使用与几乎所有/(....)/匹配的分隔符模式时,我们得到一堆空(0长度)字符串。我已使用D个字符标记了分隔符,并使用F标记了字段:

 ( '', 'a', '', '1', '', 'b', '', '2' ) == split /(.)/, 'a1b2';
   F    D   F    D   F    D   F    D

步骤4.因此,如果我们将字段数限制为3,我们得到:

 ( '', 'a', '', '1', 'b2' ) == split /(.)/, 'a1b2', 3;
   F    D   F    D   F  

步骤5.将所有内容放在一起我们可以执行此操作(我使用了.jpeg扩展名,以便扩展名超过4个字符):

 ( '', 1000, '', 2000, '', 3000, '.jpeg' ) = split /(....)/, '100020003000.jpeg',4;
   F   D     F   D     F   D     F       

步骤6.步骤5几乎是完美的,我们需要做的是删除空字符串,我们很好:

(1000,2000,3000,'。jpeg')= grep length,split /(....)/,'100020003000.jpeg',4;

此代码有效,而且很有趣。但是,任何其他解决方案都不紧凑。我没有标记,但如果它赢得任何速度或内存效率奖励,我会非常惊讶。

但真正的问题是,对于真正的代码来说,这太难了。使用split捕获分隔符(可能是一个最终字段),同时丢弃字段数据太奇怪了。它也很脆弱:如果一个字段改变了长度,代码就会被破坏并且必须被重写。

所以, 实际上并没有这样做。

至少它为探索split的一些鲜为人知的特征提供了机会。

答案 4 :(得分:0)

substrunpack都将您的思维偏向固定布局,而正则表达式解决方案更倾向于使用分隔符进行灵活布局。

您提供的示例似乎是固定布局,但目录通常通过分隔符与文件名分隔(例如,POSIX样式文件系统的斜杠,MS-DOS的反斜杠等)所以您可能实际上有一个案例对彼此而言;一个正则表达式解决方案,用于拆分目录和文件名(甚至是目录/名称/扩展名),然后是名称部分的固定长度方法。