我有一个很大的fastq文件,我想添加序列" TTAAGG"到我的文件中的每个序列的末尾(第二行,然后每隔4行),同时仍然保持fastq文件格式。例如: 这是我开始的第一行:
@HWI-D00449:41:C2H8BACXX:5:1101:1219:2053 1:N:0:
GCAATATCCTTCAACTA
+
FFFHFHGFHAGGIIIII
我希望它打印出来:
@HWI-D00449:41:C2H8BACXX:5:1101:1219:2053 1:N:0:
GCAATATCCTTCAACTATTAAGG
+
FFFHFHGFHAGGIIIII
我认为sed或awk会对此有所帮助,但我还没有找到一种能让我保持fastq格式的解决方案。
我试过了:
awk 'NR%4==2 { print $0 "TTAAGG"}' < file_in.fastq > fileout_fastq
将TTAAGG添加到第二行然后每隔四行,但它也删除了其他三行。
有没有人对我可以使用的命令行有建议,或者如果您知道目前可用的包可以执行此操作,请告诉我们!
答案 0 :(得分:0)
尝试使用GNU sed:
sed '2~4s/$/TTAAGG/' file