R |中的BioStrings错误.Call2出错(" XStringSet_align_pairwiseAlignment",模式,主题,:键15不在查找表

时间:2017-07-07 17:04:35

标签: r bioinformatics fasta bioconductor

我正在编写一个脚本,使用BioStrings包中的函数pairwiseAlignment来评估OTU序列之间的相似性。

我建立了一个带NA值的矩阵,其中下面的循环应该写在矩阵上。

    mat <- nucleotideSubstitutionMatrix(match = 2, mismatch = -3, baseOnly = TRUE)
    x = 1
    y = x + 1
    while(x < length(sequence)){
      #Converts sequences in vector to DNAString
      seq1 <- DNAString(sequence[x])  
      seq2 <- DNAString(sequence[y])
      #Performs pairwise alignment on DNAStrings
      palign1 <- pairwiseAlignment(seq1, seq2, substitutionMatrix = mat, gapOpening = 5, gapExtension = 2)  
      #Converts pairwise alignment score to percentage to store in matrix
      perc_mat[x,(y-1)] <- pid(palign1, type = "PID1")   

      if(y == length(sequence)){
        x <- x + 1
        y <- x + 1 
        print(x)
      }

      else {
        y <- y + 1 
        print(y)
      }


    }

因此,OTU是一个可操作的分类单元,我们将其与不同长度的DNA序列联系起来。举个例子,我们有两个OTU:OTU_1100972 v OTU_182893。 OTU_1100972具有以下顺序:

GACGAACGCTGGCGGCGTGCCTAATACATGCAAGTTGAGCGCTGAAGGTTGGTACTTGTACCAACTGGATGAGCAGCGAACGGGTGAGTAACGCGTGGGGAATCTGCCTTTGAGCGGGGGACAACATTTGGAAACGAATGCTAATACCGCATAAAAACTTTAAACACAAGTTTTAAGTTTGAAAGATGCAATTGCATCACTCAAAGATGATCCCGCGTTGTATTAGCTAGTTGGTGAGGTAAAGGCTCACCAAGGCGATGATACATAGCCGACCTGAGAGGGTGATCGGCCACATTGGGACTGAGACACGGCCCAAACTCCTACGGGAGGCAGCAGTAGGGAATCTTCGGCAATGGACGAAAGTCTGACCGAGCAACGCCGCGTGAGTGAAGAAGGTTTTCGGATCGTAAAACTCTGTTGGTAGAGAAGAACGTTGGTGAGAGTGGAAAGCTCATCAAGTGACGGTAACTACCCAGAAAGGGACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTCCCGAGCGTTGTCCGGATTTATTGGGCGTAAAGCGAGCGCAGGTGGTTTATTAAGTCTGGTGTAAAAGGCAGTGGCTCAACCATTGTATGCATTGGAAACTGGTAGACTTGAGTGCAGGAGAGGAGAGTGGAATTCCATGTGTAGCGGTGAAATGCGTAGATATATGGAGGAACACCGGTGGCGAAAGCGGCTCTCTGGCCTGTAACTGACACTGAGGCTCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAGTGCTAGATGTAGGGAGCTATAAGTTCTCTGTATCGCAGCTAACGCAATAAGCACTCCGCCTGGGGAGTACGACCGCAAGGTTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCAGGTCTTGACATCCCTCTGACCGCTCTAGAGAT AGAGTTTTCCTTCGGGACAGAGGTGACAGGTGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCCTATTGTTAGTTGCCATCATTCAGTTGGGCACTCTAGCGAGACTGCCGGTAATAAACCGGAGGAAGGTGGGGATGACGTCAAATCATCATGCCCCTTATGACCTGGGCTACACACGTGCTACAATGGCTGGTACAACGAGTCGCAAGCCGGTGACGGCAAGCTAATCTCTTAAAGCCAGTCTCAGTTCGGATTGTAGGCTGCAACTCGCCTACATGAAGTCGGAATCGCTAGTAATCGCGGATCAGCACGCCGCGGTGAATACGTTCCCGGGCCT

OTU_182893具有以下顺序: AGAGTTTGATCCTGGCTCAGGATAAACGCTGGCGGCGCACATAAGACATGCAAGTCGAACGGACTTAACTCATTCTTTTAGATTGAGAGCGGTTAGTGGCGGACTGGTGAGTAACACGTAAGCAACCTGCCTATCAGAGGGGAATAACAGTGAGAAATCATTGCTAATACCGCATAAGCTAGTAGTATCGCATGATATAGCTAGAAAAGGAGCAATCCGCTGATAGATGGGCTTGCGTCTGATTAGCTAGTTGGTGGGGTAACGGCATACCAAGGCGACGATCAGTAGCCGGACTGAGAGGTTGAACGGCCACATTGGAACTGAGACACGGTCCAAACTCCTACGGGAGGCAGCAGTGAGGAATATTGGTCAATGGGCGAGAGCCTGAACCAGCCAAGTCGCGTGAGGGAAGACGGTCCTATGGATTGTAAACCTCTTTTGTCAGGGAGCAAAAACTGCCACGTGTGGCAGGATGAGAGTACCTGAAGAAAAAGCATCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGATGCGAGCGTTATCCGGATTTATTGGGTTTAAAGGGTGCGTAGGCGGACAGTTAAGTCAGCGGTAAAATTGAGAGGCTCAACCTCTTCCCGCCGTTGAAACTGATTGTCTTGAGTGGGCGAGAAGTATGCGGAATGCGTGGTGTAGCGGTGAAATGCATAGATATCACGCAGAACTCCGATTGCGAAGGCAGCATACCGGCGCCCAACTGACGCTGAAGCACGAAAGCGTGGGTATCGAACAGGATTAGATACCCTGGTAGTCCACGCAGTAAACGATGAATACTAATTGTTCGGGTCAAATGAGATCTGAGTGATACAGCGAAAGCGTTAAGTATTCCACCTGGGGAGTACGCCGGCAACGGTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGAGGAACATGTGGTTTAATTTGATGATACGCGAGGAACCTTACCCGGGCTCAAACGTAGCAGGAC GTGCGCCGAAAAGCGCATTTCACTTGTGACCTGTTACGAGGTGCTGCATGGTTGTCGTCAGCTCGTGCCGTGAGGTGTCGGCTTAAGTGCCATAACGAGCGCAACCCCTGCCGCCAGTTGCTAACGCATAAAGGCGAGGACTCTGGCGGGACTGCCGGCGCAAGCCGTGAGGAAGGCGGGGATGACGTCAAATCAGCACGGCCCTTACGTCCGGGGCGACACACGTGTTACAATGGGGGGCACAGCGGGAAGCCACTTGGTGACAAGGAGCAAAACCCCCAAGCCTCTCTCAGTTCGGATTGGAGTCTGCAACCCGACTCCATGAAGCTGGATTCGCTAGTAATCGCGCATCAGCCATGGCGCGGTGAATACGTTCCCGGGCCTTGCACACACCGCCCGTCA

NCBI有一个工具,可以进行Needleman-Wunsch全球校准。使用他们的工具,我得出结论,上述序列获得了769分,其中71%相似。

有人可以帮我导航这个错误吗?谢谢!

0 个答案:

没有答案