我有一个名为mystring=AACTCGCTTT
的字符串。我想创建一个字符串模式,允许从第一个字母开始到最后一个最后一个字母有4个不匹配或kmer = 6。我想要这个,所以我可以在一个文本文件中grep这些模式。我该怎么做呢?所以我的模式看起来像这样:
????CGCTTT
A????GCTTT
AA?T???TTT
答案 0 :(得分:2)
有一个名为agrep
的工具可用于此目的:
agrep -4 AACTCGCTTT filename
在手册页中:
在每个文件或标准输入中搜索PATTERN的近似匹配项。示例:'agrep -2优化foo.txt'在两个错误中输出文件'foo.txt'中与“ optimize”匹配的所有行。例如。包含“优化”,“优化”和“优化”的行均匹配。