通过在fasta文件中添加“管道”来编辑标题

时间:2018-02-12 12:43:47

标签: grep header editing fasta

我想通过添加管道来编辑fasta文件中的标题,但无法这样做。标题看起来像这样

  

KX035646.1名称:NADH域名   ATGCGGGGCTGC ..

我希望它像

  

SP | KX035646.1 |名称:NADH域名

所有序列的登录号都不同 你能帮帮我吗?感谢

1 个答案:

答案 0 :(得分:0)

你可以尝试一个简单的sed one liner:

cat test.fasta
>KX035646.1 Name:NADH domain ATGCGGGGCTGC..
ACGT
CTTT
>KX035646.2 Name:NADH domain ATGCGGGGCTGC..43214
GCAT

sed 's/^>\([a-zA-Z0-9.]\+\)\(.*\)/>sp|\1|\2/' test.fasta
>sp|KX035646.1| Name:NADH domain ATGCGGGGCTGC..
ACGT
CTTT
>sp|KX035646.2| Name:NADH domain ATGCGGGGCTGC..43214
GCAT