使用GEOquery从GEO检索数据表头

时间:2017-07-01 00:04:50

标签: r bioinformatics text-mining bioconductor

对于GEO的一项研究,我想获得数据表标题描述,特别是研究中所有样本的“VALUE”列。

如果您go here然后向下滚动并单击其中一个示例:让我们选择“GSM2644971”。然后向下滚动,您应该看到“数据表标题描述”,下面你应该看到“VALUE Normalized(提供规范化方法)平均Beta”。这些信息就是我想要的。

我尝试使用 Biobase 包中的assayData(),但我不知道该方法是采用样本,样本矩阵还是其他东西作为参数。显然它需要一个S4,然后返回一些随机文本,但我不知道如何使用该随机文本。

修改

例如,如果我这样做:

library(Biobase)
library(GEOquery)

getgeo<-getGEO("GSE99511")
assayData(getgeo$GSE99511_series_matrix.txt.gz)

当我使用assayData()时,我希望它返回:

  

“标准化(提供标准化方法)平均Beta”。

相反,它返回:

  

<environment: 0x110674178>

如果问题没有意义,或者我还应该使用其他方法,请告诉我。

1 个答案:

答案 0 :(得分:0)

您可以使用exprs函数获取规范化的beta值,例如:

e <- exprs(getgeo$GSE99511_series_matrix.txt.gz)
head(e)