如果我在文本文件中有一个表,比如
我在另一个文本文件中有另一个符号列表。我想将此表转换为Perl数据结构,如:
但我只需要一些选定的符号,例如在符号文本中选择A,D和E,但B和C不是。
答案 0 :(得分:2)
第一个使用数组,第二个使用二维哈希。第一个看起来应该大致如下:
$list[0] # row 1 - the value is "A B 1"
和哈希一样:
$hash{A}{A} # the intersection of A and A - the value is 0
找出如何解决问题大约是我心理战的75%。我不打算详细介绍如何打印哈希或数组,因为这很容易,而且我也不完全清楚你想要如何打印或打印多少。但是将数组转换为哈希应该看起来像这样:
foreach (@list) {
my ($letter1, $letter2, $value) = split(/ /);
$hash{$letter1}{$letter2} = $value;
}
至少,我认为这就是你要找的东西。如果真的想要你可以使用正则表达式,但这对于从字符串中提取3个值可能有点过分。
编辑:当然,您可以放弃@list
并直接从文件中汇总哈希。但这是你的工作,而不是我的。
答案 1 :(得分:1)
你可以用awk试试这个:
awk -f matrix.awk yourfile.txt> newfile.matrix.txt
其中matrix.awk是:
BEGIN {
OFS="\t"
}
{
row[$1,$2]=$3
if (!($2 in f2)) { header=(header)?header OFS $2:$2;f2[$2]}
if (col1[c]!=$1)
col1[++c]=$1
}
END {
printf("%*s%s\n", length(col1[1])+2, " ",header)
ncol=split(header,colA,OFS)
for(i=1;i<=c;i++) {
printf("%s", col1[i])
for(j=1;j<=ncol;j++)
printf("%s%s%c", OFS, row[col1[i],colA[j]], (j==ncol)?ORS:"")
}
}
答案 2 :(得分:0)
另一种方法是制作二维数组 -
my @fArray = ();
## Set the 0,0th element to "_"
push @{$fArray[0]}, '_';
## Assuming that the first line is the range of characters to skip, e.g. BC
chomp(my $skipExpr = <>);
while(<>) {
my ($xVar, $yVar, $val) = split;
## Skip this line if expression matches
next if (/$skipExpr/);
## Check if these elements have already been added in your array
checkExists($xVar);
checkExists($yVar);
## Find their position
for my $i (1..$#fArray) {
$xPos = $i if ($fArray[0][$i] eq $xVar);
$yPos = $i if ($fArray[0][$i] eq $yVar);
}
## Set the value
$fArray[$xPos][$yPos] = $fArray[$yPos][$xPos] = $val;
}
## Print array
for my $i (0..$#fArray) {
for my $j (0..$#{$fArray[$i]}) {
print "$fArray[$i][$j]", " ";
}
print "\n";
}
sub checkExists {
## Checks if the corresponding array element exists,
## else creates and initialises it.
my $nElem = shift;
my $found;
$found = ($_ eq $nElem ? 1 : 0) for ( @{fArray[0]} );
if( $found == 0 ) {
## Create its corresponding column
push @{fArray[0]}, $nElem;
## and row entry.
push @fArray, [$nElem];
## Get its array index
my $newIndex = $#fArray;
## Initialise its corresponding column and rows with '_'
## this is done to enable easy output when printing the array
for my $i (1..$#fArray) {
$fArray[$newIndex][$i] = $fArray[$i][$newIndex] = '_';
}
## Set the intersection cell value to 0
$fArray[$newIndex][$newIndex] = 0;
}
}
我对我处理参考文献的方式并不感到自豪,但在这里与初学者相关(请在评论中留下您的建议/更改)。上面提到的Chris的哈希方法听起来要容易得多(更不用说打字少了很多)。
答案 3 :(得分:0)
CPAN有很多potentially useful suff。我出于多种目的使用Data::Table。 Data::Pivot看起来也很有希望,但我从未使用它。