Perl 2D数组比较问题

时间:2013-01-09 21:38:23

标签: performance perl multidimensional-array

我正在编写一个perl脚本,用于审核库并将已安装软件的列表与另一台机器上的列表进行比较,以确保它们正在使用相同的东西。我已经将原始数据放入两个大小为Nx4的二维数组中,其中N是软件标题的数量。例如:

[Fileset1], [1.0.2.3], [COMMITTED], [Description of file]
[Fileset2], [2.4.2.2], [COMMITTED], [Description of a different file]
....

我现在需要比较两个列表以找出差异,是否缺少级别差异文件。还不是perl pro,我能想​​到这样做的唯一方法是将第一个数组的每个元素与另一个数组的每个元素进行比较,首先查找匹配不同级别的文件集或根本没有匹配的文件集。我必须用另一个列表重复这个过程,以确保我找到了所有可能的差异。显然,通过这个程序,我正在寻找大于n ^ 2的效率。我想知道是否有一些grep的应用程序,我可以使用或类似的东西,以避免这种比较库与超过20,000个条目。

简而言之,我需要比较两个二维数组并跟踪每个列表的差异,而不是仅仅找到两者的交集。

提前感谢您的帮助!

1 个答案:

答案 0 :(得分:3)

输出有点笨拙,但我喜欢Data::Diff这样的任务:

use Data::Diff 'Diff';
use Data::Dumper;

@a = ( ["Fileset1", "1.0.2.3", "COMMITTED", "Description of file" ],
       ["Fileset2", "2.4.2.2", "COMMITTED", "Description of a different file" ],
       ["Fileset3", "1.2.3.4", "COMMITTED", "Description of a different file" ] );

@b = ( ["Fileset1", "1.0.2.3", "COMMITTED", "Description of file" ],
       ["Fileset2", "2.4.2.99", "COMMITTED", "Description of a different file" ] );    

$out = Diff(\@a,\@b);    
print Dumper($out);

结果:

$VAR1 = {
  'diff' => [
    {
      'uniq_a' => [
        '2.4.2.2'
      ],
      'same' => [
        {
          'same' => 'COMMITTED',
          'type' => ''
        },
        {
          'same' => 'Description of a different file',
          'type' => ''
        },
        {
          'same' => 'Fileset2',
          'type' => ''
        }
      ],
      'type' => 'ARRAY',
      'uniq_b' => [
        '2.4.2.99'
      ]
    }
  ],
  'uniq_a' => [
    [
      'Fileset3',
      '1.2.3.4',
      'COMMITTED',
      'Description of a different file'
    ]
  ],
  'same' => [
    {
      'same' => [
        {
          'same' => '1.0.2.3',
          'type' => ''
        },
        {
          'same' => 'COMMITTED',
          'type' => ''
        },
        {
          'same' => 'Description of file',
          'type' => ''
        },
        {
          'same' => 'Fileset1',
          'type' => ''
        }
      ],
      'type' => 'ARRAY'
    }
  ],
  'type' => 'ARRAY'
};