使用zcat批量组合文件列表

时间:2016-09-20 20:53:21

标签: bash

我有一个包含许多文件的文件夹需要合并,我正在寻找一个好的命令来完成它。文件如下所示:

Concatenate Together:
A1_S1_L001_R1_001.fastq.gz
A1_S1_L002_R1_001.fastq.gz
A1_S1_L003_R1_001.fastq.gz
A1_S1_L004_R1_001.fastq.gz

Concatenate Together:
A1_S1_L001_R2_001.fastq.gz
A1_S1_L002_R2_001.fastq.gz
A1_S1_L003_R2_001.fastq.gz
A1_S1_L004_R2_001.fastq.gz

Concatenate Together:
B1_S1_L001_R1_001.fastq.gz
B1_S1_L002_R1_001.fastq.gz
B1_S1_L003_R1_001.fastq.gz
B1_S1_L004_R1_001.fastq.gz

Concatenate Together:
B1_S1_L001_R2_001.fastq.gz
B1_S1_L002_R2_001.fastq.gz
B1_S1_L003_R2_001.fastq.gz
B1_S1_L004_R2_001.fastq.gz

etc.

因此,模式是对于数百个文件,第一个字母和数字(此处为A1或B1)是指包含两个子组(R1和R2)的组。主要组是A1-H1,A2-H2和A3-H3。在每个子组中有四个文件(L001,L002,L003,L004)。

有没有一种简单的方法可以简单地将它们与zcat(或其他任何方式)结合起来?

1 个答案:

答案 0 :(得分:2)

这样的事情应该这样做:

cd "/path/to/the/directory" || exit 1
for num in {1..3}; do
    for letter in {A..H}; do
        for subgroup in R1 R2; do
            zcat "$letter$num"_S1_L*_"$subgroup"_001.fastq.gz > "$letter$num-$subgroup"
        done
    done
done

您可能需要调整输出文件的名称(可能还有路径)。我使用了"$letter$num-$subgroup",例如B1-R1