我想按字母顺序对%hash{'name'}
的内容进行排序,以保持@{$hash{$keys}}
其他元素的相关性。
我该怎么做?
my %hash = (
date => [
qw(
2018/01/12
2018/03/01
2018/03/20
2018/04/04
)
],
time => [
qw(
03:00:02
01:00:01
00:24:39
11:33:33
)
],
name => [
qw(
jerry
tom
micky
agata
)
]
);
所需的输出:
date;time;name
2018/04/04;11:33:33;agata
2018/01/12;03:00:02;jerry
2018/03/20;00:24:39;micky
2018/03/01;01:00:01;tom
我还没有尝试过任何东西,因为我不知道从哪里开始。
答案 0 :(得分:3)
我选择此解决方案是因为我想在脚本中按日期进行另一个排序。有了关键参考,它将变得更加聪明...
这是您问题的核心部分。您的想法是正确的,但是您以错误的方式实施了它。那就是现在把你带到这个角落。
让我们先看一下您的数据。您说这是一个日志文件,所以它是基于行的。我已经整理好了这种格式。
On 2018/01/12 at 03:00:02 user jerry did stuff.
On 2018/03/01 at 01:00:01 user tom did stuff.
On 2018/03/20 at 00:24:39 user micky did stuff.
On 2018/04/04 at 11:33:33 user agata did stuff.
您的预期输出是CSV文件。同样,这是基于行的。
date;time;name 2018/04/04;11:33:33;agata 2018/01/12;03:00:02;jerry 2018/03/20;00:24:39;micky 2018/03/01;01:00:01;tom
因此,有理由认为您希望数据位于其中的结构仍基于行。
如果要按任何列对这些数据进行排序,则要根据列中的值对行进行排序。因此,您确实希望以一种易于访问该行的每个单独列的值的方式存储行。在电子表格中查看后,这一点尤其清晰。
每列都是一行的一个值。因此,让我们这样做。
my @events; # or something like that
while (my $row = <$log_fh>) {
my ( $date, $time, $name ) = parse_row($row); # we don't care about this implementation
push @events, {
date => $date,
time => $time,
name => $name,
};
}
现在我们有了这个数据结构(我已经用Data::Printer输出了)。
[
[0] {
date "2018/01/12",
name "jerry",
time "03:00:02"
},
[1] {
date "2018/03/01",
name "tom",
time "01:00:01"
},
[2] {
date "2018/03/20",
name "micky",
time "00:24:39"
},
[3] {
date "2018/04/04",
name "agata",
time "11:33:33"
}
]
如您所见,每行有一个哈希引用,其中包含用于日期的键,用于时间的键和用于名称的键。
现在,我们可以对这些结构内的任何键进行排序。 That's easy。
my @events_by_name = sort { $a->{name} cmp $b->{name} } @events;
my @events_by_date = sort { $a->{date} cmp $b->{date} } @events;
my @events_by_time = sort { $a->{time} cmp $b->{time} } @events;
然后您可以为每个文件生成CSV文件。
open my $fh, '>', 'events_by_name.csv' or die $!;
foreach my $event (@events_by_name) {
print $fh join ';', $event->{name}, $event->{date}, $event->{time};
print $fh "\n";
}
close $fh;
或者您可以迭代事件的数量,一次打开多个事件,而仅循环一次。
open my $fh_name, '>', 'events_by_name.csv' or die $!;
open my $fh_date, '>', 'events_by_date.csv' or die $!;
for (my $i = 0; $i < @events_by_name; $i++) {
print $fh_name join(
';',
@events_by_name->[$i]->{name},
@events_by_name->[$i]->{date},
@events_by_name->[$i]->{time},
);
print $fh_name "\n";
print $fh_date join(
';',
@events_by_name->[$i]->{name},
@events_by_name->[$i]->{date},
@events_by_name->[$i]->{time},
);
print $fh_date "\n";
}
close $fh_name;
close $fh_date;
您可以使用另一个循环来进一步缩短此时间。
open my $fh_name, '>', 'events_by_name.csv' or die $!;
open my $fh_date, '>', 'events_by_date.csv' or die $!;
for (my $i = 0; $i < @events_by_name; $i++) {
foreach my $fh ($fh_name, $fh_date) {
print $fh join(
';',
@events_by_name->[$i]->{name},
@events_by_name->[$i]->{date},
@events_by_name->[$i]->{time},
);
print $fh "\n";
}
}
close $fh_name;
close $fh_date;
如您所见,在处理线时,使结构保持基于线的意义更大。