如何用sed替换任何不是“A”,“C”,“G”,“T”,“N”的字符串?
例如,我有以下数据:
>AFCCCCC 1
cagktgagtgataaggc
>AFCGH22 1
cagntgagtgstaaggc
我想删除不是以'>'开头的不是[ACGTN]的所有字符
因此我希望得到这个输出:
>AFCCCCC 1
cagtgagtgataaggc
>AFCGH22 1
cagntgagtgtaaggc
请注意,我删除了第一个和第二个序列的'k'和's'。
答案 0 :(得分:2)
试试这个:
sed '/^>/!s/[^ACGTN]//ig' input.txt