如何使用SED删除不是[ACGTN]的字符

时间:2012-07-05 23:47:01

标签: linux unix sed

如何用sed替换任何不是“A”,“C”,“G”,“T”,“N”的字符串?

例如,我有以下数据:

>AFCCCCC 1
cagktgagtgataaggc
>AFCGH22 1
cagntgagtgstaaggc

我想删除不是以'>'开头的不是[ACGTN]的所有字符

因此我希望得到这个输出:

 >AFCCCCC 1
 cagtgagtgataaggc
 >AFCGH22 1
 cagntgagtgtaaggc

请注意,我删除了第一个和第二个序列的'k'和's'。

1 个答案:

答案 0 :(得分:2)

试试这个:

sed '/^>/!s/[^ACGTN]//ig' input.txt