为什么fastx_trimmer认为我的fastq文件是未知的文件格式?

时间:2014-08-29 00:53:01

标签: bioinformatics fasta sequencing fastq

我有一些Illumina NextSeq运行的.fastq文件。许多序列具有poly-A束,使得映射复杂化。我想删除十个连续A的所有序列,并且一直尝试使用fastx_clipper,如下所示:

ha1c6n8$ fastx_clipper -l 32 -Q33 -n -v -a AAAAAAAAAA –i FR0826_S1_L004_R1_001.fastq –o FR0826_L004_trimmed.fastq

这导致以下错误消息:

fastx_clipper: input file (-) has unknown file format (not FASTA or FASTQ), first character = (10)

我不完全确定这意味着什么。我使用head查看了fastq文件:

ha5c6n8$ head FR0826_S1_L004_R1_001.fastq

@NS500289:18:H1237BGXX:4:11401:2791:1023 1:N:0:1
NCTACATTGGTTCCTCAGCCAAGCACATACACCAAATGTCTGAACCTGCGGTACCTCTCGTACTGAGCAGGATT
+
#<<AAFAFFFAFFFFF7FF)FF.F<FAFFFFF<FF.AFFF7F.F.FFAFFFF)7AF7F<FFF<<F7FFFFFF7F
@NS500289:18:H1237BGXX:4:11401:19266:1023 1:N:0:1
NAATGGGTCTGCGAGAGCGCCAGCTATCCTGAGGGAAACTTCGGAGGGGGCCGGCTACTAGATGGTTCGCTTAGT
+
#<7AAFAFFFFFFFF7FFAA.AFF<F...<AFFFF7F..FA.A<AA<F7)FA7.FF.<FA..F.A7AF..FFF.A
@NS500289:18:H1237BGXX:4:11401:6297:1023 1:N:0:1
NATAAGAGGGGTGTGGCTAGGCTAAGCGTTTTGAGCTGCATTGCTGCGTGCTTGATGCTTGTCCCTTTTGATCGT

据我所知,这看起来像一个完全正常的fastq格式文件。任何人都可以解释导致此错误的原因吗? 谢谢!

1 个答案:

答案 0 :(得分:0)

您的fastq文件以新行(ASCII值10)开头,这是不允许的。删除第一行,它应该没问题。