我有两组文件。一个文件给出基因名称列表(每行一个基因)。第二个文件具有基因对列表(例如,=>'1,2'和一个基因对perl系)。基因名称是数字。我想列出除已知基因对之外的所有可能的基因组合。
我的输出应该是:
3,4
4,5
6,7
...
...
但是,我得到像这样的东西=>
,4
,5
,7
所有第一个元素都不打印。我不确定代码究竟出了什么问题。有人可以帮忙吗?
我的代码:
#! usr/bin/perl
use strict;
use warnings;
if (@ARGV !=2) {
die "Usage: generate_random_pairs.pl <entrez_genes> <known_interactions>\n";
}
my ($e_file, $k_file) = @ARGV;
open (IN, $e_file) or die "Error!! Cannot open $e_file\n";
open (IN2, $k_file) or die "Error!! Cannot open $k_file\n";
my @e_file = <IN>; chomp (@e_file);
my @k_file = <IN2>; chomp (@k_file);
my (%known_interactions, %random_interactions);
foreach my $line (@k_file) {
my @array = split (/,/, $line);
$known_interactions{$array[0]} = $array[1];
}
for (my $i = 0; $i <= $#e_file; $i++) {
for (my $j = $i+1 ; $j <= $#e_file; $j++) {
if ((exists $known_interactions{$e_file[$i]}) && ($known_interactions{$e_file[$i]} == $e_file[$j])) {next;}
if ((exists $known_interactions{$e_file[$j]}) && ($known_interactions{$e_file[$j]} == $e_file[$i])) {next;}
print "$e_file[$i],$e_file[$j]\n";
}
}
答案 0 :(得分:3)
您的文件使用CR LF作为行结尾,但您使用的是使用LF进行行结尾的系统,因此您的程序输出
"3" <CR> "," "4" <CR> <LF>
您的终端显示为
,4
使用
修复行结尾dos2unix inputfile
或更改
chomp(@e_file);
chomp(@k_file);
到
s/\s+\z// for @e_file;
s/\s+\z// for @k_file;