我想通过添加管道来编辑fasta文件中的标题,但无法这样做。标题看起来像这样
KX035646.1名称:NADH域名 ATGCGGGGCTGC ..
我希望它像
SP | KX035646.1 |名称:NADH域名
所有序列的登录号都不同 你能帮帮我吗?感谢
答案 0 :(得分:0)
你可以尝试一个简单的sed one liner:
cat test.fasta
>KX035646.1 Name:NADH domain ATGCGGGGCTGC..
ACGT
CTTT
>KX035646.2 Name:NADH domain ATGCGGGGCTGC..43214
GCAT
sed 's/^>\([a-zA-Z0-9.]\+\)\(.*\)/>sp|\1|\2/' test.fasta
>sp|KX035646.1| Name:NADH domain ATGCGGGGCTGC..
ACGT
CTTT
>sp|KX035646.2| Name:NADH domain ATGCGGGGCTGC..43214
GCAT