在R

时间:2015-11-25 04:43:09

标签: r vector

我试图在SNP侧面的1Mb内可视化LD块。而且我不想使用Haploview,因为它使用Hap Map 3(构建17程序集),这已经过时了。 所以我使用在线工具" VCF到PED转换器"从1000 Genomes阶段3下载了SNP数据。我有.ped和.info文件。然后我使用了一个R包'LDheatmap'(它可以在r ^ 2中计算LD并且可以在热图中可视化LD)。但1000个基因组中的文件(.ped,.info文件)与LDheatmap的输入文件不兼容。

LDheatmap的示例数据集" CEUData"包含数据帧和向量。格式如下:

  • CEUSNP:SNP基因型的数据框。每行代表一个 个人。每列代表一个SNP。 SNP ID是每列的标题。
  • CEUDist:整数向量,代表SNP物理图 染色体上的位置。

有没有人知道如何将1000个基因组中的.ped和.info文件转换为R中LDheatmap包的兼容输入文件(数据帧和矢量)?

1 个答案:

答案 0 :(得分:0)

您可以使用Bioconductor软件包snpStats中的read.pedfile()函数将pedfile读取到一个SnpMatrix对象中,该对象可以传递给LDheatmap。