Question

有没有人知道将单核苷酸多态性（SNP）ID从rs＃转换为SNP_A-＃的方法？我有两个SNP，rs429358和rs4420638，需要确定这些SNP是否包含在不同的数据集中。数据集对SNP ID使用SNP_A-xxxxx符号。任何帮助将不胜感激！

Answer 1

你应该问生物星：http://www.biostars.org/show/questions/

SNP_A ###不是官方命名法。它来自哪里？

比较您的ID的唯一方法是比较染色体/位置/ allele-ref / allele-alt。

Answer 2

SNP_A ###标识符很可能是Affymetrix SNP ID。您将需要知道它们来自哪个阵列，但它可能是人类全基因组SNP 6.0。

您可以从Affymetrix网站下载注释数据，该数据将为＃affyid＃mapping提供rs＃。尝试从：http://www.affymetrix.com/support/mas/index.affx#1_1

开始

选择＆＃34;注释文件＆＃34;在＆＃34;软件和数据＆＃34;用于Genomewide SNP 6.0阵列产品。

一个问题是阵列上的一些探针集是多余的 - 对于一个小的子集，你将有多个affyid＃mapping到一个rsid＃

Answer 3

SNP_A *标识符是Affymetrix SNP ID。我也必须做类似的事情，但规模要大得多......使用Affymetrix Annotation文件＆＃34; Genomewide SNP 6.0＆＃34;从这里开始并没有像我想要的那样映射：http://www.affymetrix.com/support/mas/index.affx#1_1

我所做的是使用Biopython（我在Python3中做过）。首先，你必须通过pip安装biopython。

执行此操作后，您可以使用Entrez库来使用esearch（）方法。以下是一些示例代码：

from Bio import Entrez

Entrez.email = '<email address>'
handle = Entrez.esearch(db='snp', retmax='1', sort='SNP_ID', term='<affymetrix id>')
results = Entrez.read(handle)
rsNumber = 'rs'+results['IdList'][0]

这应该从affymetrix id中为您提供正确的rs号。

SNP ID转换

3 个答案: