如何创建FASTQ序列文件?

时间:2011-07-10 01:14:37

标签: bioinformatics fastq

我有一个基因组数据库,其中包含一个简单的字符序列(如>chr1 AGTGTCA.....)。现在,我想将其转换为标准FASTQ format,如下所示:

@HWUSI-EAS594-R:1:3:1453:1350#0/1 
CCCAGTTCCGACGATCGATTTGCACGTCAGAATCGCTACGGACCTCCATCAGGGTTTCCCCTGACTTCGTCCTGACCAGG
+   
ea^cdfdffgggggggggggeggggdggdffgdbdgddgggg`g^dfbfgdggcfbgfffcb]gffbfcfcefbbBBBB

由于我不清楚这种格式,我无法转换它。如何将简单字符序列转换为FASTQ格式(如上例所示)?

具体来说,我在问:

  1. 是否有任何现有代码可以进行编码?
  2. 如果没有,我如何在FASTQ中编码字符序列?这种格式意味着什么,我该如何创建呢?

1 个答案:

答案 0 :(得分:4)

因为您只有序列而不是序列派生的quality (reliability) scores,所以认为您没有足够的信息来构建FASTQ文件。 (但我不是生物信息学专家。)相反,您应该继续使用仅包含序列信息的FASTA file format