我有一个包含以下格式的双列文件:
CLL s_S616447
CLL s_S612703
MBL s_S599565
MBL s_S577819
UnAff s_S509781
UnAff s_S754982
我想用三个键创建哈希," CLL"," MBL"和" UnAff"。使用下面的代码,我可以将第一列指定为键,将第二列指定为值,但我不知道如何对键进行分组,因此哈希只有这三个键而不是文件中每一行的键。
到目前为止,这就是我的全部内容:
open REF, "list.txt";
my %sam_type = ();
while (<REF>) {
chomp $_;
@cols = split("\t", $_);
my $type = $cols[0];
my $sample = $cols[1];
$sam_type{$type} = $sample;
}
有人能引导我朝着正确的方向前进吗?
答案 0 :(得分:5)
您需要hash of arrays(HoA):
use strict;
use warnings;
use Data::Dump;
my %hash;
while (<DATA>) {
my @fields = split;
push(@{$hash{$fields[0]}}, $fields[1]);
}
dd(\%hash);
__DATA__
CLL s_S616447
CLL s_S612703
MBL s_S599565
MBL s_S577819
UnAff s_S509781
UnAff s_S754982
输出:
{
CLL => ["s_S616447", "s_S612703"],
MBL => ["s_S599565", "s_S577819"],
UnAff => ["s_S509781", "s_S754982"],
}
答案 1 :(得分:-1)
使用数组引用的散列的另一种方法是使用普通的字符串散列,只需在值之间加上逗号或其他内容:
$sam_type{$type} .= ",$sample";
如果需要,可以将字符串拆分为数组。