从一些人类单核苷酸多态性(SNP)开始,如何查询所有已知SNPS的数据库,以便生成1000个左右最近的SNPS,天气与否的列表(data.table或csv文件) SNP是一个tagSNP,它的次要等位基因频率(MAF)是多少,它与起始SNPS的距离是多少?
我更愿意在R中这样做(尽管不一定如此)。我应该使用哪个数据库?我唯一的出发点是列出起始的snps(例如rs3091244,rs6311等)。
我确信有一个很好的简单Bioconductor包可能是我的出发点。但是什么?你做过吗?我想它可以在大约3到5行代码中完成。
答案 0 :(得分:0)
同样这是偏离主题的,但你实际上可以通过BROAD的这个基于Web的工具完成你提到的所有事情:
http://www.broadinstitute.org/mpg/snap/ldsearch.php
您只需输入一个snp,它会为您提供周围的snps窗口,您也可以导出到csv。
祝你的遗传项目好运!