通过拆分字符串来填充数组

时间:2018-06-07 17:06:06

标签: perl

我正在尝试将字符串转换为基于空格分隔符的数组。

我的输入文件如下所示:

>Reference
nnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnn
nnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnn
nnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnn
nnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnn
nnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnctcACCATGGTGTCGACTC
TTCTATGGAAACAGCGTGGATGGCGTCTCCAGGCGATCTGACGGTTCACTAAACGAGCTC

忽略以>开头的行,字符串的剩余长度为360。

我正在尝试将其转换为数组。

到目前为止,这是我的代码:

#!/usr/bin/perl

use strict;
use warnings;

#### To to change bases with less than 10X coverage to N #####

#### Take depth file and consensus fasta file as input arguments ####

my ($in2) = @ARGV;

my $args = $#ARGV + 1;

if ( $args != 1 ) {
    print "Error!!! Insufficient Number of Argumrnts\n";
    print "Usage: $0 <consensus fasta file> \n";
}

#### Open a filehandle to read in consensus fasta file ####

    my $FH2;
    my $line;
    my @consensus;
    my $char;

    open($FH2, '<', $in2) || die "Could not open file $in2\n";

    while ( <$FH2> ) {
        $line = $_;
        chomp $line;
        next if $line =~ />/; # skip header line 
        $line =~ s/\s+//g;

        my $len = length($line);
        print "$len\n";
        #print "$line";

        @consensus = split(// , $line);
        print "$#consensus\n";
        #print "@consensus\n";

        #for $char (0 .. $#consensus){
    #   print "$char: $consensus[$char]\n";
     #   }
    }

问题是$len变量返回值60而不是360而$#consensus返回值59而不是360,这是字符串的长度。

我在代码$line =~ s/\s+//g;的每一行之后删除了空格,但它仍然无效。

1 个答案:

答案 0 :(得分:1)

看起来您的代码基本上正常运行。它只是你的检查逻辑没有意义。我执行以下操作:

use strict;
use warnings;

if (@ARGV != 1) {
    print STDERR "Usage: $0 <consensus fasta file>\n";
    exit 1;
}

open my $fh, '<', $ARGV[0] or die "$0: cannot open $ARGV[0]: $!\n";

my @consensus;
while (my $line = readline $fh) {
    next if $line =~ /^>/;

    $line =~ s/\s+//g;
    push @consensus, split //, $line;
}

print "N = ", scalar @consensus, "\n";

需要注意的主要事项:

  • 错误消息应转至STDERR,而不是STDOUT
  • 如果发生错误,程序应退出并显示错误代码,而不是继续运行。
  • 错误消息应包括程序名称和错误原因。
  • 如果您要删除所有空格,
  • chomp是多余的。
  • 当您逐行处理输入时,您可以继续将元素推送到@consensus的末尾。在循环结束时,它将累积所有行中的所有字符。
  • 在循环中检查@consensus毫无意义,因为它还没有完成构建。只有在循环之后,我们才会拥有我们感兴趣的所有角色。