我正在尝试将字符串转换为基于空格分隔符的数组。
我的输入文件如下所示:
>Reference
nnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnn
nnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnn
nnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnn
nnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnn
nnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnctcACCATGGTGTCGACTC
TTCTATGGAAACAGCGTGGATGGCGTCTCCAGGCGATCTGACGGTTCACTAAACGAGCTC
忽略以>
开头的行,字符串的剩余长度为360。
我正在尝试将其转换为数组。
到目前为止,这是我的代码:
#!/usr/bin/perl
use strict;
use warnings;
#### To to change bases with less than 10X coverage to N #####
#### Take depth file and consensus fasta file as input arguments ####
my ($in2) = @ARGV;
my $args = $#ARGV + 1;
if ( $args != 1 ) {
print "Error!!! Insufficient Number of Argumrnts\n";
print "Usage: $0 <consensus fasta file> \n";
}
#### Open a filehandle to read in consensus fasta file ####
my $FH2;
my $line;
my @consensus;
my $char;
open($FH2, '<', $in2) || die "Could not open file $in2\n";
while ( <$FH2> ) {
$line = $_;
chomp $line;
next if $line =~ />/; # skip header line
$line =~ s/\s+//g;
my $len = length($line);
print "$len\n";
#print "$line";
@consensus = split(// , $line);
print "$#consensus\n";
#print "@consensus\n";
#for $char (0 .. $#consensus){
# print "$char: $consensus[$char]\n";
# }
}
问题是$len
变量返回值60而不是360而$#consensus
返回值59而不是360,这是字符串的长度。
我在代码$line =~ s/\s+//g;
的每一行之后删除了空格,但它仍然无效。
答案 0 :(得分:1)
看起来您的代码基本上正常运行。它只是你的检查逻辑没有意义。我执行以下操作:
use strict;
use warnings;
if (@ARGV != 1) {
print STDERR "Usage: $0 <consensus fasta file>\n";
exit 1;
}
open my $fh, '<', $ARGV[0] or die "$0: cannot open $ARGV[0]: $!\n";
my @consensus;
while (my $line = readline $fh) {
next if $line =~ /^>/;
$line =~ s/\s+//g;
push @consensus, split //, $line;
}
print "N = ", scalar @consensus, "\n";
需要注意的主要事项:
STDERR
,而不是STDOUT
。chomp
是多余的。@consensus
的末尾。在循环结束时,它将累积所有行中的所有字符。@consensus
毫无意义,因为它还没有完成构建。只有在循环之后,我们才会拥有我们感兴趣的所有角色。