合并具有相似子字符串的文件

时间:2016-02-09 10:14:22

标签: awk cat

我想合并共享类似文件名开头的配对文件。输出应该是在相应输入文件中找到的唯一名称。 我不知道怎么做,但cat会以某种方式做。

107_MAE_E7_S11_L001_R1_001.fastq.gz
107_MAE_E7_S11_L002_R1_001.fastq.gz
108_IME_A8_S23_L001_R1_001.fastq.gz
108_IME_A8_S23_L002_R1_001.fastq.gz

out

107_MAE_E7_S11.fastq.gz
108_IME_A8_S23.fastq.gz

1 个答案:

答案 0 :(得分:0)

从您的示例(如果它代表所有文件名不清楚),您可以剪切文件的中间部分,并使用uniq。你的关键取决于所有文件是否真的像你上面的那样。

示例:

# cut -c1-14,27- myfilename | uniq
107_MAE_E7_S11.fastq.gz
108_IME_A8_S23.fastq.gz