我试图在SNP侧面的1Mb内可视化LD块。而且我不想使用Haploview,因为它使用Hap Map 3(构建17程序集),这已经过时了。 所以我使用在线工具" VCF到PED转换器"从1000 Genomes阶段3下载了SNP数据。我有.ped和.info文件。然后我使用了一个R包'LDheatmap'(它可以在r ^ 2中计算LD并且可以在热图中可视化LD)。但1000个基因组中的文件(.ped,.info文件)与LDheatmap的输入文件不兼容。
LDheatmap的示例数据集" CEUData"包含数据帧和向量。格式如下:
有没有人知道如何将1000个基因组中的.ped和.info文件转换为R中LDheatmap包的兼容输入文件(数据帧和矢量)?
答案 0 :(得分:0)
您可以使用Bioconductor软件包snpStats中的read.pedfile()函数将pedfile读取到一个SnpMatrix对象中,该对象可以传递给LDheatmap。