匹配2个或更多选项perl

时间:2016-10-27 20:45:58

标签: perl bioinformatics qiime

我有两种格式来自qiime分析,一种来自silva数据库,另一种来自GreenGenes。这些文件之间的区别在于,silva文件对每个分类单元都有一个渐进的D_number(王国= D_0__,门名= D_1__,clase = D_2__等等),而GreenGenes文件的每个分类单元都有一个字母(王国= K__,门= p__ ,clase = c__等等)

file_1 (Silva format)
D_0__Archaea;D_1__Euryarchaeota;D_2__Thermoplasmata;D_3__Thermoplasmatales;D_4__ASC21;D_5__uncultured euryarchaeote



file_2(GreenGenes format)
k__Bacteria;p__Actinobacteria;c__Actinobacteria;o__Actinomycetales;f__Streptomycetaceae;g__Streptomyces

所以我在Perl中制作了两个脚本(一个用于席尔瓦,另一个用于GreenGenes),以便在一个单独的文件中提取每个分类单元。

我正在尝试在两种格式的匹配部分中加入一段代码,我的意思是:

第16行中的

,我想要两个选项,例如:

my @kingd=($taxon_value[0]=~m/D_0__(.*);D_1/g | m/k__(.*);p/g);

嗯,我知道它不起作用

那么如何在匹配正则表达式的同一行中添加两个或更多选项?

这是脚本的一部分(它有6个选项,我只是写了Kingdom选项!!):

while (<INPUTFILE>){
    $line=$_;
    chomp($line);
    if ($line=~ m/^#/g){
        next;
    }
    elsif ($line=~ m/^[Uu]nassigned/g){
        next;
    }
    elsif ($line){
        my @full_line = $_;
        foreach (@full_line){
            my (@taxon_value)= split (/\t/, $_);
            foreach ($taxon_value[0]){
                if ($kingdom){
                    my @kingd=($taxon_value[0]=~m/D_0__(.*);D_1/g); # just for silva
                    foreach (@kingd){
                        if ($_=~/^$/){
                            next;
                        }
                        elsif ($_=~ m/^[Uu]nknown/g){
                            next;
                        }
                        elsif ($_=~ m/^[Uu]ncultured$/g){
                            next;
                        }
                        elsif ($_=~ m/^[Uu]nidentified$/g){
                            next;
                        }
                        else {
                            push @taxon_list, $_;
                        }
                    }
                }
           }
      }
 }

谢谢

1 个答案:

答案 0 :(得分:2)

您需要在模式中执行。您可以使用已有的管道|来完成此操作。但它需要进入模式。无需两个匹配运算符。

my @kingd = $taxon_value[0] =~ m/D_0__(.*);D_1|k__(.*);p/g

现在它将匹配一个或另一个。有关详细信息,请参阅perlreperlretut。您还应该在SO上阅读regex标签wiki中提供的信息,因为它包含许多有用工具的链接。

您在代码中执行的操作是使用Perl的|运算符,bitwise or