我有几个要使用vsearch(https://github.com/torognes/vsearch)进行群集的fasta文件,并保存一个“质心文件” 和“聚类结果文件” 每个Fasta文件。
由于我有很多文件,因此我计划利用vsearch的多线程功能,并在下面编写了循环:
#!/bin/bash
# input fasta files
fastaFile=*.fasta
# vsearch cluster_fast loop
for f in $fastaFile
do
vsearch --cluster_fast \
$f \
--id 1 \
--qmask none \
--centroids $f.$centroids.txt \
--uc $f.uc.txt
done
不幸的是,似乎一次在每个fasta文件上使用了多线程,但我不知道如何在vsearch之外组织并行化。