我试图使用这个脚本(vcf-consensus)和一个简单的例子,但我有一个错误:序列" 7"在fasta文件中找不到。
语法是:
Usage: cat ref.fa | vcf-consensus [OPTIONS] in.vcf.gz > out.fa
我的FASTA文件是:
TGGCTGGAACGGGACCTCACATTCTGTATTTGTCCCGATTGGCTAGCAACTTAGAACTTT
我的VCF文件是:
##fileformat=VCFv4.1
#CHROM POS ID REF ALT QUAL FILTER INFO FORMAT SAMPLE
7 1 . T A . . . GT 0/1
7 2 . G A . . . GT 0/1
7 3 . G A . . . GT 0/1
7 4 . C A . . . GT 0/1
我通过bgzip压缩并通过tabix VCF文件索引:
bgzip vcfFile.vcf
tabix -p vcfFile.vcf.gz
然后,我执行:
cat fastaFile.fa | vcf-consensus vcfFile.vcf.gz > out.fa
我收到此错误: 序列" 7"在fasta文件中找不到。
有人知道吗?
感谢。
答案 0 :(得分:0)
你的VCF只包含染色体' 7'在第1栏。
但你的fasta标题是
>gi|157696558|ref|NW_001838997.1| Homo sapiens chromosome 7 genomic scaffold, alternate assembly HuRef SCAF_1103279187418, whole genome shotgun sequence
如果您的fasta标题只是:,tabix就可以了
>7