如何将样本ID复制并粘贴到标题的末尾

时间:2016-12-19 19:01:53

标签: sed

我有一个带有标题的fasta文件,看起来像......

>DNA1111_0

>DNA2987_1

>DNA3674_5

我如何使用sed修改标题,使它们看起来像......

>DNA1111_0;sample=DNA1111

>DNA2987_1;sample=DNA2987

>DNA3674_5;sample=DNA3674

我无法得到正确的修改,谢谢。

2 个答案:

答案 0 :(得分:0)

使用GNU sed:

sed -E 's/^>(.*)(_.*)$/>\1\2;sample=\1/' file

输出:

>DNA1111_0;sample=DNA1111

>DNA2987_1;sample=DNA2987

>DNA3674_5;sample=DNA3674

答案 1 :(得分:0)

任何支持-E的sed(例如GNU和OSX seds):

$ sed -E 's/([^>_]+).*/&;sample=\1/' file
>DNA1111_0;sample=DNA1111

>DNA2987_1;sample=DNA2987

>DNA3674_5;sample=DNA3674