错误vcf-consensus脚本

时间:2014-11-22 19:00:37

标签: bioinformatics fasta vcf consensus variants

我试图使用这个脚本(vcf-consensus)和一个简单的例子,但我有一个错误:序列" 7"在fasta文件中找不到。

语法是:

Usage: cat ref.fa | vcf-consensus [OPTIONS] in.vcf.gz > out.fa

我的FASTA文件是:

TGGCTGGAACGGGACCTCACATTCTGTATTTGTCCCGATTGGCTAGCAACTTAGAACTTT

我的VCF文件是:

##fileformat=VCFv4.1
#CHROM  POS ID  REF ALT QUAL    FILTER  INFO    FORMAT  SAMPLE
7   1   .   T   A   .   .   .   GT  0/1
7   2   .   G   A   .   .   .   GT  0/1
7   3   .   G   A   .   .   .   GT  0/1
7   4   .   C   A   .   .   .   GT  0/1

我通过bgzip压缩并通过tabix VCF文件索引:

bgzip vcfFile.vcf
tabix -p vcfFile.vcf.gz

然后,我执行:

cat fastaFile.fa | vcf-consensus vcfFile.vcf.gz > out.fa

我收到此错误:     序列" 7"在fasta文件中找不到。

有人知道吗?

感谢。

1 个答案:

答案 0 :(得分:0)

你的VCF只包含染色体' 7'在第1栏。

但你的fasta标题是

>gi|157696558|ref|NW_001838997.1| Homo sapiens chromosome 7 genomic scaffold, alternate assembly HuRef SCAF_1103279187418, whole genome shotgun sequence
如果您的fasta标题只是:

tabix就可以了

>7