拆分大文件,将第一行添加为文件名

时间:2017-02-13 14:38:43

标签: awk sed split grep

我在下面给出了大文件给出的样本。我想把它拆分成多个文件,第一行是文件名'FP3SLUG00012600.txt'

我能够从“>”开始将其拆分为多个但无法将第一行命名为文件名。

在档案中:

>FP3SLUG00012600
ACCCTCCACGACACTCCTCAAGATCTCACCAAAATGCCCGGCAAGGTCAAGGCGTATGAG
>FP3SLUG00012602
ACCCTCCACGACACTCCTCAAGATCTCACCAAAATGCCCGGCAAGGTCAAGGCGTATGAG
>FP3SLUG00012603
ACCCTCCACGACACTCCTCAAGATCTCACCAAAATGCCCGGCAAGGTCAAGGCGTATGAG
>FP3SLUG00012604
ACCCTCCACGACACTCCTCAAGATCTCACCAAAATGCCCGGCAAGGTCAAGGCGTATGAG

内容所需的输出文件

file1:FP3SLUG00012604.txt

>FP3SLUG00012604
ACCCTCCACGACACTCCTCAAGATCTCACCAAAATGCCCGGCAAGGTCAAGGCGTATGAG

file2的:FP3SLUG00012603.txt

 >FP3SLUG00012603
ACCCTCCACGACACTCCTCAAGATCTCACCAAAATGCCCGGCAAGGTCAAGGCGTATGAG

1 个答案:

答案 0 :(得分:1)

您可以尝试使用awk拆分multifasta文件

awk '/^>/{filename=substr($1,2) ".txt"}{print > filename}' file.fasta

你得到几个文件,其序列格式为fasta