我想在plink中按家庭ID分割我的床,bim和fam文件。 例如,我可以通过键入以下内容来完成此操作:
p-link --bfile datafile1 --chr 1 --make-bed --out datafile2
这为1号染色体制作了一个单独的床,bim和fam文件。
但是,在我的fam文件中,我有几个不同的系列ID,我想分割文件。例如
Family 1 TS11339 0 0 2 -9
Family 1 TS11233 0 0 2 -9
Family 2 TF99288 0 0 2 -9
Family 2 YJ22997 0 0 2 -9
Family 3 YF00277 0 0 2 -9
Family 3 YY92779 0 0 2 -9
我想要Family1.bed -.bim和-.bam,Family2.bed -.bim和-.bam等。
我该怎么做? (抱歉,知识匮乏 - 刚开始使用plink)。
答案 0 :(得分:1)
更简单一点:plink --keep-fam。
答案 1 :(得分:0)
我想通了,你可以通过plink做到如下:
p-link --bfile datafile1 --keep LIST1.txt --make-bed --out
其中LIST1.txt是家庭ID和个人的列表。因此,如果您想要提取族1,LIST1.txt将包含:
家庭1 TS11339
家庭1 TS11233
更多信息可以在plink网站上找到。
答案 2 :(得分:0)
以下命令应该在UNIX shell上拆分plink数据集:
for fam in $(awk '{print $1}' datafile1.fam | sort | uniq); do echo $fam | plink --bfile datafile1 --keep-fam /dev/stdin --make-bed --out $fam; done