SNP ID转换

时间:2012-08-20 21:16:50

标签: bioinformatics

有没有人知道将单核苷酸多态性(SNP)ID从rs#转换为SNP_A-#的方法?我有两个SNP,rs429358和rs4420638,需要确定这些SNP是否包含在不同的数据集中。数据集对SNP ID使用SNP_A-xxxxx符号。任何帮助将不胜感激!

3 个答案:

答案 0 :(得分:2)

你应该问生物星:http://www.biostars.org/show/questions/

SNP_A ###不是官方命名法。它来自哪里?

比较您的ID的唯一方法是比较染色体/位置/ allele-ref / allele-alt。

答案 1 :(得分:1)

SNP_A ###标识符很可能是Affymetrix SNP ID。您将需要知道它们来自哪个阵列,但它可能是人类全基因组SNP 6.0。

您可以从Affymetrix网站下载注释数据,该数据将为#affyid#mapping提供rs#。尝试从:http://www.affymetrix.com/support/mas/index.affx#1_1

开始

选择"注释文件"在"软件和数据"用于Genomewide SNP 6.0阵列产品。

一个问题是阵列上的一些探针集是多余的 - 对于一个小的子集,你将有多个affyid#mapping到一个rsid#

答案 2 :(得分:0)

SNP_A *标识符是Affymetrix SNP ID。我也必须做类似的事情,但规模要大得多......使用Affymetrix Annotation文件" Genomewide SNP 6.0"从这里开始并没有像我想要的那样映射:http://www.affymetrix.com/support/mas/index.affx#1_1

我所做的是使用Biopython(我在Python3中做过)。首先,你必须通过pip安装biopython

执行此操作后,您可以使用Entrez库来使用esearch()方法。以下是一些示例代码:

from Bio import Entrez

Entrez.email = '<email address>'
handle = Entrez.esearch(db='snp', retmax='1', sort='SNP_ID', term='<affymetrix id>')
results = Entrez.read(handle)
rsNumber = 'rs'+results['IdList'][0]

这应该从affymetrix id中为您提供正确的rs号。