如何在unix中为给定字符串创建kmer模式?

时间:2018-10-24 15:18:00

标签: bash unix grep

我有一个名为mystring=AACTCGCTTT的字符串。我想创建一个字符串模式,允许从第一个字母开始到最后一个最后一个字母有4个不匹配或kmer = 6。我想要这个,所以我可以在一个文本文件中grep这些模式。我该怎么做呢?所以我的模式看起来像这样:

????CGCTTT
A????GCTTT
AA?T???TTT

1 个答案:

答案 0 :(得分:2)

有一个名为agrep的工具可用于此目的:

agrep -4 AACTCGCTTT filename

在手册页中:

  

在每个文件或标准输入中搜索PATTERN的近似匹配项。示例:'agrep -2优化foo.txt'在两个错误中输出文件'foo.txt'中与“ optimize”匹配的所有行。例如。包含“优化”,“优化”和“优化”的行均匹配。