我有1000 G数据集,它是PLINK格式,有一些名称为"."
的snps,PLINK中是否有任何方法我可以删除该snps?
我尝试了无效的bcftool视图。
答案 0 :(得分:1)
执行以下命令
plink --bfile $YOUR_GENOTYPE_FILE --extract SNPS_TO_EXCLUDE.txt --make-bed --out $NEW_GENOTYPE_FILE
其中$
变量是您所需的PLINK BED / BIM / BAM文件前缀。
SNPS_TO_EXCLUDE.txt
看起来像什么?来自PLINK website:
--extract
通常接受带有变体ID列表的文本文件(通常每行一个,但它们可以用空格分隔),并从当前删除所有未列出的变体分析。
--exclude
对所有列出的变体都做同样的事情。
因此,SNPS_TO_EXCLUDE.txt
应包含一行" .
"。