我在下面给出了大文件给出的样本。我想把它拆分成多个文件,第一行是文件名'FP3SLUG00012600.txt'
我能够从“>”开始将其拆分为多个但无法将第一行命名为文件名。
在档案中:
>FP3SLUG00012600 ACCCTCCACGACACTCCTCAAGATCTCACCAAAATGCCCGGCAAGGTCAAGGCGTATGAG >FP3SLUG00012602 ACCCTCCACGACACTCCTCAAGATCTCACCAAAATGCCCGGCAAGGTCAAGGCGTATGAG >FP3SLUG00012603 ACCCTCCACGACACTCCTCAAGATCTCACCAAAATGCCCGGCAAGGTCAAGGCGTATGAG >FP3SLUG00012604 ACCCTCCACGACACTCCTCAAGATCTCACCAAAATGCCCGGCAAGGTCAAGGCGTATGAG
内容所需的输出文件
file1:FP3SLUG00012604.txt
>FP3SLUG00012604 ACCCTCCACGACACTCCTCAAGATCTCACCAAAATGCCCGGCAAGGTCAAGGCGTATGAG
file2的:FP3SLUG00012603.txt
>FP3SLUG00012603 ACCCTCCACGACACTCCTCAAGATCTCACCAAAATGCCCGGCAAGGTCAAGGCGTATGAG
答案 0 :(得分:1)
您可以尝试使用awk
拆分multifasta文件
awk '/^>/{filename=substr($1,2) ".txt"}{print > filename}' file.fasta
你得到几个文件,其序列格式为fasta