合并来自不同目录的公共文件中的列,并将列标题重命名为它来自的目录?

时间:2013-09-29 00:14:16

标签: perl

我的Perl代码严重受损。我想从不同目录中的一个名为'file.txt'的公共文件中合并一个名为'value'的列。所有这些文件都具有相同的行数。这些文件有多列但我有兴趣只合并一个名为'value'的列。我想创建一个已合并所有'value'列的文件,但列的标题应该从它来自的目录中命名。

指南-A
file.txt的

ID  Value location
 1   50     9
 2   56     5
 3   26     5

指南-B
file.txt的

ID  Value location
 1   07      9
 2   05      2
 3   02      5

指南-C
file.txt的

ID  Value location
 1   21     9
 2   68     3
 3   42     5

我的输出应该是一个组合表,如下所示:

ID  Directory-A  Directory-B  Directory-C
 1   50              07           21
 2   56              06           68
 3   26              02           42

我的perl脚本合并了文件中的所有列而不是我感兴趣的特定列,我不知道如何重命名标题。 非常感谢您的建议。

1 个答案:

答案 0 :(得分:0)

如果您的文件以制表符分隔,则可以执行以下操作:

#!/usr/bin/perl

use strict;
use warnings;
use autodie;

my @result;
my @files = ( "directory-a/file.txt", "directory-b/file.txt", "directory-c/file.txt" );

my $i = 0;
foreach my $filename ( @files ) {
    $result[ $i ] = [];
    open( my $file, "<", $filename );
    while ( my $line = <$file> ) {
        my @columns = split( /\t/, $line );
        push( @{ $result[ $i ] }, $columns[1] ); # getting values only from the column we need
    }
    close $file;
    $i++;
}

my $max_count = 0;
foreach my $column ( @result ) {
    $max_count = scalar( @$column ) if ( scalar( @$column ) > $max_count );
}

open ( my $file, ">", "result.txt" );
for ( 0 .. $max_count - 1 ) {
    my @row;
    foreach my $col ( @result ) {
        my $value = shift( @$col ) || "";
        push( @row, $value );       
    }
    print $file join( "\t", @row ), "\n";
};
close $file;