R:biomaRt包缺少探针ID?

时间:2012-07-12 13:45:58

标签: r

我遇到了biomaRt包的问题,​​当时我正在寻找entyytrix for affymetrix hgu133a探针组ID。例如,biomaRt找不到“206323_x_at” 当我在affy_hg_u133a列表中列出所有探针ID时,只有19872个探针ID,但是在HGU133a上有22245个探针(或22313个具有对照探针)。脚本有问题或者这个数据库不完整吗?

谢谢!

library(biomaRt)  
mart<-useMart("ensembl", dataset="hsapiens_gene_ensembl")  
affyids="206323_x_at"  
getBM(attributes=c('affy_hg_u133a', 'entrezgene'), filters = 'affy_hg_u133a', values = affyids, mart = mart)  
[1] affy_hg_u133a entrezgene   
<0 rows> (or 0-length row.names)

hgu133a<-getBM(attributes='affy_hg_u133a', mart = mart)
dim(hgu133a)
[1] 19872     1

2 个答案:

答案 0 :(得分:1)

它似乎不适用于此探针集。我们可以用

获得答案
library(hgu133a.db)
myprobeset  = "206323_x_at"
genes <- mget(myprobeset,hgu133aENTREZID)

我们可以测试另一个探针集

affyids = c("218471_s_at")
getBM(attributes = c("affy_hg_u133a", "entrezgene"), filters =  "affy_hg_u133a",values = affyids, mart = ensembl)

myprobeset  = "218471_s_at"
genes <- mget(myprobeset,hgu133aENTREZID)

所以这似乎是两种不同数据来源给出不同答案的情况。这种情况时不时发生。

答案 1 :(得分:0)

probemapper包也可用于此特定需求。它在R中可用,并且还有一个在线界面。

以下是您特定基因的结果: qbrc.swmed.edu/probealignment/#probe=1005849

解释:供应商和Bioconductor同意您的探针与Entrez ID 4983对齐,但BLAST显示了一些其他可能的对齐(如果您只关心供应商的注释,可能会忽略它)。