我有一个带有标题的fasta文件,看起来像......
>DNA1111_0
>DNA2987_1
>DNA3674_5
我如何使用sed修改标题,使它们看起来像......
>DNA1111_0;sample=DNA1111
>DNA2987_1;sample=DNA2987
>DNA3674_5;sample=DNA3674
我无法得到正确的修改,谢谢。
答案 0 :(得分:0)
使用GNU sed:
sed -E 's/^>(.*)(_.*)$/>\1\2;sample=\1/' file
输出:
>DNA1111_0;sample=DNA1111 >DNA2987_1;sample=DNA2987 >DNA3674_5;sample=DNA3674
答案 1 :(得分:0)
任何支持-E
的sed(例如GNU和OSX seds):
$ sed -E 's/([^>_]+).*/&;sample=\1/' file
>DNA1111_0;sample=DNA1111
>DNA2987_1;sample=DNA2987
>DNA3674_5;sample=DNA3674