我正在尝试找到具有特定条件的模式搜索:我们必须找到起始位置。 也允许不止一个不匹配,即。它应该运行1或2或3不匹配。 即,对于1个不匹配,图案的一个字符在匹配时可以匹配或不匹配 顺序。对于2个不匹配相同,模式的两个字符在匹配时可能匹配也可能不匹配 顺序。等等。
output: should be written into a file in a table format:
e.g, pattern may be TGCA and sequence may be ATCGATGCATATCGATC....]
finding TGCA in sequence ATCGATGATATCGATC will result in
S.no position the_matched_pattern
1 5 TGCA
匹配和不匹配可以在任何位置(即,在相同位置或不同位置)。我该如何实现呢?
答案 0 :(得分:1)
通常,这是最常见的子序列问题。做一些关于“Smith-Waterman”算法的研究 - 你应该实现它。
http://en.wikipedia.org/wiki/Smith-Waterman_algorithm
http://en.wikipedia.org/wiki/Longest_common_subsequence_problem