如何排序此哈希数组?

时间:2018-06-27 10:03:17

标签: perl

我想按字母顺序对%hash{'name'}的内容进行排序,以保持@{$hash{$keys}}其他元素的相关性。

我该怎么做?

my %hash = (
    date => [
        qw(
            2018/01/12
            2018/03/01
            2018/03/20
            2018/04/04
        )
    ],
    time => [
        qw(
            03:00:02
            01:00:01
            00:24:39
            11:33:33            
        )
    ],
    name => [
        qw(
            jerry
            tom
            micky
            agata            
        )
    ]
);

所需的输出:

date;time;name
2018/04/04;11:33:33;agata
2018/01/12;03:00:02;jerry
2018/03/20;00:24:39;micky
2018/03/01;01:00:01;tom

我还没有尝试过任何东西,因为我不知道从哪里开始。

1 个答案:

答案 0 :(得分:3)

  

我选择此解决方案是因为我想在脚本中按日期进行另一个排序。有了关键参考,它将变得更加聪明...

这是您问题的核心部分。您的想法是正确的,但是您以错误的方式实施了它。那就是现在把你带到这个角落。

让我们先看一下您的数据。您说这是一个日志文件,所以它是基于行的。我已经整理好了这种格式。

On 2018/01/12 at 03:00:02 user jerry did stuff.
On 2018/03/01 at 01:00:01 user tom did stuff.
On 2018/03/20 at 00:24:39 user micky did stuff.
On 2018/04/04 at 11:33:33 user agata did stuff.

您的预期输出是CSV文件。同样,这是基于行的。

date;time;name
2018/04/04;11:33:33;agata
2018/01/12;03:00:02;jerry
2018/03/20;00:24:39;micky
2018/03/01;01:00:01;tom

因此,有理由认为您希望数据位于其中的结构仍基于行。

如果要按任何列对这些数据进行排序,则要根据列中的值对进行排序。因此,您确实希望以一种易于访问该行的每个单独列的值的方式存储行。在电子表格中查看后,这一点尤其清晰。

screenshot of libreoffice spreadsheet with the example data

每列都是一行的一个值。因此,让我们这样做。

my @events; # or something like that
while (my $row = <$log_fh>) {
    my ( $date, $time, $name ) = parse_row($row); # we don't care about this implementation

    push @events, {
        date => $date,
        time => $time,
        name => $name,
    };
}

现在我们有了这个数据结构(我已经用Data::Printer输出了)。

[
    [0] {
        date   "2018/01/12",
        name   "jerry",
        time   "03:00:02"
    },
    [1] {
        date   "2018/03/01",
        name   "tom",
        time   "01:00:01"
    },
    [2] {
        date   "2018/03/20",
        name   "micky",
        time   "00:24:39"
    },
    [3] {
        date   "2018/04/04",
        name   "agata",
        time   "11:33:33"
    }
]

如您所见,每行有一个哈希引用,其中包含用于日期的键,用于时间的键和用于名称的键。

现在,我们可以对这些结构内的任何键进行排序。 That's easy

my @events_by_name = sort { $a->{name} cmp $b->{name} } @events;
my @events_by_date = sort { $a->{date} cmp $b->{date} } @events;
my @events_by_time = sort { $a->{time} cmp $b->{time} } @events;

然后您可以为每个文件生成CSV文件。

open my $fh, '>', 'events_by_name.csv' or die $!;
foreach my $event (@events_by_name) {
    print $fh join ';', $event->{name}, $event->{date}, $event->{time};
    print $fh "\n";
}
close $fh;

或者您可以迭代事件的数量,一次打开多个事件,而仅循环一次。

open my $fh_name, '>', 'events_by_name.csv' or die $!;
open my $fh_date, '>', 'events_by_date.csv' or die $!;
for (my $i = 0; $i < @events_by_name; $i++) {
    print $fh_name join(
         ';', 
         @events_by_name->[$i]->{name}, 
         @events_by_name->[$i]->{date}, 
         @events_by_name->[$i]->{time},
    ); 
    print $fh_name "\n";

    print $fh_date join(
         ';', 
         @events_by_name->[$i]->{name}, 
         @events_by_name->[$i]->{date}, 
         @events_by_name->[$i]->{time},
    ); 
    print $fh_date "\n";
}
close $fh_name;
close $fh_date;

您可以使用另一个循环来进一步缩短此时间。

open my $fh_name, '>', 'events_by_name.csv' or die $!;
open my $fh_date, '>', 'events_by_date.csv' or die $!;
for (my $i = 0; $i < @events_by_name; $i++) {
    foreach my $fh ($fh_name, $fh_date) {
        print $fh join(
             ';', 
             @events_by_name->[$i]->{name}, 
             @events_by_name->[$i]->{date}, 
             @events_by_name->[$i]->{time},
        ); 
        print $fh "\n";
    }
}
close $fh_name;
close $fh_date;

如您所见,在处理线时,使结构保持基于线的意义更大。