我有一个包含数千个序列的.fasta文件,这些序列的名称看起来像:“> JN935654.1 Abies alba tRNA-Leu(trnL)基因.....”
我想删除登录号(示例中为JN935654.1),并使用以下代码:
sed 's/[^ ]* />/' file_1.fasta > file_2.fasta
这将返回序列名称为:“> Abies alba tRNA-Leu(trnL)基因.....”。登录号已删除。
我自己没有编写此代码,但它确实满足我的要求。但是,我不理解该代码。有人可以解释吗?我是Ubuntu终端的初学者。
我知道sed命令是某种文本编辑器,而^&*是某种特殊字符,可对每个数字进行计数。
谢谢!