我有一个包含许多文件的文件夹需要合并,我正在寻找一个好的命令来完成它。文件如下所示:
Concatenate Together:
A1_S1_L001_R1_001.fastq.gz
A1_S1_L002_R1_001.fastq.gz
A1_S1_L003_R1_001.fastq.gz
A1_S1_L004_R1_001.fastq.gz
Concatenate Together:
A1_S1_L001_R2_001.fastq.gz
A1_S1_L002_R2_001.fastq.gz
A1_S1_L003_R2_001.fastq.gz
A1_S1_L004_R2_001.fastq.gz
Concatenate Together:
B1_S1_L001_R1_001.fastq.gz
B1_S1_L002_R1_001.fastq.gz
B1_S1_L003_R1_001.fastq.gz
B1_S1_L004_R1_001.fastq.gz
Concatenate Together:
B1_S1_L001_R2_001.fastq.gz
B1_S1_L002_R2_001.fastq.gz
B1_S1_L003_R2_001.fastq.gz
B1_S1_L004_R2_001.fastq.gz
etc.
因此,模式是对于数百个文件,第一个字母和数字(此处为A1或B1)是指包含两个子组(R1和R2)的组。主要组是A1-H1,A2-H2和A3-H3。在每个子组中有四个文件(L001,L002,L003,L004)。
有没有一种简单的方法可以简单地将它们与zcat(或其他任何方式)结合起来?
答案 0 :(得分:2)
这样的事情应该这样做:
cd "/path/to/the/directory" || exit 1
for num in {1..3}; do
for letter in {A..H}; do
for subgroup in R1 R2; do
zcat "$letter$num"_S1_L*_"$subgroup"_001.fastq.gz > "$letter$num-$subgroup"
done
done
done
您可能需要调整输出文件的名称(可能还有路径)。我使用了"$letter$num-$subgroup"
,例如B1-R1
。