justRMA和read.affybatch之间的注释差异

时间:2015-09-17 09:18:09

标签: bioconductor

我试图从带有探测名称的CEL文件中获取原始表达式数据。但是我无法获得探测器名称。

我尝试使用read.affybatch作为以下内容:

library(affy)
smallest_file <- "GSM766572.CEL.gz"    
setwd("/data0/RtmpGPL/raw")
a <- read.affybatch(smallest_file)
c <- justRMA(filenames = c(smallest_file), normalize=FALSE)

然而,当我用

检查内容时
head(exprs(a))

内容

  GSM766572.CEL.gz
1              157
2            15900
3              171
4            15673
5               56
6              115

我想要的是下面的内容(使用head(exprs(c))生成)

          GSM766572.CEL.gz
1007_s_at         9.636495
1053_at           6.574971
117_at            5.966103
121_at            8.559288
1255_g_at         4.508790
1294_at           8.320684

但是使用原始表达水平。

我不明白为什么我无法获得具有原始表达水平的探测名称。请帮忙。

由于

1 个答案:

答案 0 :(得分:0)

阅读justrma codea solution我猜我想要的东西可以通过以下方式实现:

tmp <- ReadAffy(filenames=c("GSM766572.CEL.gz"),celfile.path = "/data0/RtmpGPL/raw")
pmIndex <- pmindex(tmp)
probeintensities <- pm(tmp)
probenames <- rep(names(pmIndex), unlist(lapply(pmIndex,length)))
rownames(probeintensities) <- probenames

这会产生类似下面的内容:

          GSM766572.CEL.gz
1007_s_at            352.0
1007_s_at            790.0
1007_s_at            853.0
1007_s_at           4383.5
1007_s_at           3090.0
1007_s_at           2239.0