用R检索GWAS信息

时间:2011-10-11 09:24:48

标签: r genetics

我正试图从GWAS catalog获取与疾病相关的具体信息。这可以通过电子表格下载直接从网站完成。但是我想知道我是否可以在R中以编程方式进行。任何建议都将非常感谢。

感谢。

Avoks

2 个答案:

答案 0 :(得分:2)

检查函数download.file()和包rcurl(http://cran.r-project.org/web/packages/RCurl/index.html) - 这应该做你想要的

答案 1 :(得分:0)

您必须先下载 .tsv 文件并手动编辑它们。    这是因为GWAS目录文件包含HTML符号,例如“Behçet病”中的 &#x000A7 (定义特殊的第四个字母)。这些符号中的 将被R解释为行尾,因此您将收到错误消息,例如:

line 2028 did not have 34 elements

所以你首先打开它,在纯文本编辑器中打开,自动用空字符替换每个 ,然后只用以下内容将其加载到R中:

read.table("gwas_catalog_v1.0-associations_e91_r2018-02-21.tsv",sep="\t",h=T,stringsAsFactors = F,quote="")