我正在编写一个脚本,使用BioStrings包中的函数pairwiseAlignment来评估OTU序列之间的相似性。
我建立了一个带NA值的矩阵,其中下面的循环应该写在矩阵上。
mat <- nucleotideSubstitutionMatrix(match = 2, mismatch = -3, baseOnly = TRUE)
x = 1
y = x + 1
while(x < length(sequence)){
#Converts sequences in vector to DNAString
seq1 <- DNAString(sequence[x])
seq2 <- DNAString(sequence[y])
#Performs pairwise alignment on DNAStrings
palign1 <- pairwiseAlignment(seq1, seq2, substitutionMatrix = mat, gapOpening = 5, gapExtension = 2)
#Converts pairwise alignment score to percentage to store in matrix
perc_mat[x,(y-1)] <- pid(palign1, type = "PID1")
if(y == length(sequence)){
x <- x + 1
y <- x + 1
print(x)
}
else {
y <- y + 1
print(y)
}
}
因此,OTU是一个可操作的分类单元,我们将其与不同长度的DNA序列联系起来。举个例子,我们有两个OTU:OTU_1100972 v OTU_182893。 OTU_1100972具有以下顺序:
GACGAACGCTGGCGGCGTGCCTAATACATGCAAGTTGAGCGCTGAAGGTTGGTACTTGTACCAACTGGATGAGCAGCGAACGGGTGAGTAACGCGTGGGGAATCTGCCTTTGAGCGGGGGACAACATTTGGAAACGAATGCTAATACCGCATAAAAACTTTAAACACAAGTTTTAAGTTTGAAAGATGCAATTGCATCACTCAAAGATGATCCCGCGTTGTATTAGCTAGTTGGTGAGGTAAAGGCTCACCAAGGCGATGATACATAGCCGACCTGAGAGGGTGATCGGCCACATTGGGACTGAGACACGGCCCAAACTCCTACGGGAGGCAGCAGTAGGGAATCTTCGGCAATGGACGAAAGTCTGACCGAGCAACGCCGCGTGAGTGAAGAAGGTTTTCGGATCGTAAAACTCTGTTGGTAGAGAAGAACGTTGGTGAGAGTGGAAAGCTCATCAAGTGACGGTAACTACCCAGAAAGGGACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTCCCGAGCGTTGTCCGGATTTATTGGGCGTAAAGCGAGCGCAGGTGGTTTATTAAGTCTGGTGTAAAAGGCAGTGGCTCAACCATTGTATGCATTGGAAACTGGTAGACTTGAGTGCAGGAGAGGAGAGTGGAATTCCATGTGTAGCGGTGAAATGCGTAGATATATGGAGGAACACCGGTGGCGAAAGCGGCTCTCTGGCCTGTAACTGACACTGAGGCTCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAGTGCTAGATGTAGGGAGCTATAAGTTCTCTGTATCGCAGCTAACGCAATAAGCACTCCGCCTGGGGAGTACGACCGCAAGGTTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCAGGTCTTGACATCCCTCTGACCGCTCTAGAGAT AGAGTTTTCCTTCGGGACAGAGGTGACAGGTGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCCTATTGTTAGTTGCCATCATTCAGTTGGGCACTCTAGCGAGACTGCCGGTAATAAACCGGAGGAAGGTGGGGATGACGTCAAATCATCATGCCCCTTATGACCTGGGCTACACACGTGCTACAATGGCTGGTACAACGAGTCGCAAGCCGGTGACGGCAAGCTAATCTCTTAAAGCCAGTCTCAGTTCGGATTGTAGGCTGCAACTCGCCTACATGAAGTCGGAATCGCTAGTAATCGCGGATCAGCACGCCGCGGTGAATACGTTCCCGGGCCT
OTU_182893具有以下顺序: AGAGTTTGATCCTGGCTCAGGATAAACGCTGGCGGCGCACATAAGACATGCAAGTCGAACGGACTTAACTCATTCTTTTAGATTGAGAGCGGTTAGTGGCGGACTGGTGAGTAACACGTAAGCAACCTGCCTATCAGAGGGGAATAACAGTGAGAAATCATTGCTAATACCGCATAAGCTAGTAGTATCGCATGATATAGCTAGAAAAGGAGCAATCCGCTGATAGATGGGCTTGCGTCTGATTAGCTAGTTGGTGGGGTAACGGCATACCAAGGCGACGATCAGTAGCCGGACTGAGAGGTTGAACGGCCACATTGGAACTGAGACACGGTCCAAACTCCTACGGGAGGCAGCAGTGAGGAATATTGGTCAATGGGCGAGAGCCTGAACCAGCCAAGTCGCGTGAGGGAAGACGGTCCTATGGATTGTAAACCTCTTTTGTCAGGGAGCAAAAACTGCCACGTGTGGCAGGATGAGAGTACCTGAAGAAAAAGCATCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGATGCGAGCGTTATCCGGATTTATTGGGTTTAAAGGGTGCGTAGGCGGACAGTTAAGTCAGCGGTAAAATTGAGAGGCTCAACCTCTTCCCGCCGTTGAAACTGATTGTCTTGAGTGGGCGAGAAGTATGCGGAATGCGTGGTGTAGCGGTGAAATGCATAGATATCACGCAGAACTCCGATTGCGAAGGCAGCATACCGGCGCCCAACTGACGCTGAAGCACGAAAGCGTGGGTATCGAACAGGATTAGATACCCTGGTAGTCCACGCAGTAAACGATGAATACTAATTGTTCGGGTCAAATGAGATCTGAGTGATACAGCGAAAGCGTTAAGTATTCCACCTGGGGAGTACGCCGGCAACGGTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGAGGAACATGTGGTTTAATTTGATGATACGCGAGGAACCTTACCCGGGCTCAAACGTAGCAGGAC GTGCGCCGAAAAGCGCATTTCACTTGTGACCTGTTACGAGGTGCTGCATGGTTGTCGTCAGCTCGTGCCGTGAGGTGTCGGCTTAAGTGCCATAACGAGCGCAACCCCTGCCGCCAGTTGCTAACGCATAAAGGCGAGGACTCTGGCGGGACTGCCGGCGCAAGCCGTGAGGAAGGCGGGGATGACGTCAAATCAGCACGGCCCTTACGTCCGGGGCGACACACGTGTTACAATGGGGGGCACAGCGGGAAGCCACTTGGTGACAAGGAGCAAAACCCCCAAGCCTCTCTCAGTTCGGATTGGAGTCTGCAACCCGACTCCATGAAGCTGGATTCGCTAGTAATCGCGCATCAGCCATGGCGCGGTGAATACGTTCCCGGGCCTTGCACACACCGCCCGTCA
NCBI有一个工具,可以进行Needleman-Wunsch全球校准。使用他们的工具,我得出结论,上述序列获得了769分,其中71%相似。
有人可以帮我导航这个错误吗?谢谢!