Linux for循环2输入和4输出

时间:2015-06-18 18:53:43

标签: bash shell for-loop awk

我需要帮助来编写for循环。

Input: file01_R1.fastq,file01_R2.fastq。我有100个文件,例如file02_R1.fastq,file02_R2.fastq等等。

Output: file01_R1_PE.fastq,file01_R1_SE.fastq,file01_R2_PE.fastq,file01_R2_SE.fastq

我需要编写一个for循环,这样我就可以为所有100个文件运行一个可执行文件。请帮忙!

3 个答案:

答案 0 :(得分:3)

我假设给定文件

file01_R1.fastq

你想要跑:

Trimmomatic file01_R1.fastq file01_R2.fastq -o file01_R1_PE.fastq file01_R1_SE.fastq file01_R2_PE.fastq file01_R2_SE.fastq

使用GNU Parallel看起来像这样:

parallel Trimmomatic {} {= s/_R1/_R2/ =} -o {= s/_R1/_R1_PE/ =} {= s/_R1/_R1_SE/ =} {= s/_R1/_R2_PE/ =} {= s/_R1/_R2_SE/ =} ::: *_R1.fastq

GNU Parallel是一个通用的并行程序,可以在同一台计算机上或在您具有ssh访问权限的多台计算机上轻松并行运行作业。

如果要在4个CPU上运行32个不同的作业,并行化的直接方法是在每个CPU上运行8个作业:

Simple scheduling

GNU Parallel会在完成后生成一个新进程 - 保持CPU处于活动状态,从而节省时间:

GNU Parallel scheduling

<强>安装

如果没有为您的发行版打包GNU Parallel,您可以进行个人安装,不需要root访问权限。这可以在10秒内完成:

(wget -O - pi.dk/3 || curl pi.dk/3/ || fetch -o - http://pi.dk/3) | bash

有关其他安装选项,请参阅http://git.savannah.gnu.org/cgit/parallel.git/tree/README

了解详情

查看更多示例:http://www.gnu.org/software/parallel/man.html

观看介绍视频:https://www.youtube.com/playlist?list=PL284C9FF2488BC6D1

完成教程:http://www.gnu.org/software/parallel/parallel_tutorial.html

注册电子邮件列表以获得支持:https://lists.gnu.org/mailman/listinfo/parallel

答案 1 :(得分:2)

for file in *
do
    some_command_that_does_something_unspecified "$file"
done

答案 2 :(得分:0)

将'R1.fastq'文件存储在一个数组中并运行所有'R2.fastq'文件的循环

R1.fastq=*_R1.fastq
for R2.fastq in *_R2.fastq
i=0
do command ${R1.fastq[$((i++))]} $R2.fastq
done

根据Trimmomatic

的要求命名输出文件