如何使用GEOquery包提取样本标题(名称)?

时间:2013-01-10 21:44:05

标签: r bioinformatics geo

GEOquery是一个很棒的R软件包,用于检索和分析NCBI Gene Expression Omnibus (GEO) database中存储的基因表达数据。我使用了GEO数据库GEO2R服务提供的以下代码(生成初始R脚本来自动分析您想要的数据),以提取一些GEO系列实验:

gset <- getGEO("GSE10246", GSEMatrix =TRUE)
if (length(gset) > 1) idx <- grep("GPL1261", attr(gset, "names")) else idx <- 1
    gset <- gset[[idx]]
gset # displays a summary of the data stored in this variable

问题是我无法从中检索样本标题。我找到了一些函数Columns(),它可以在GDS数据集上运行并返回样本名称,但不会返回GSE。

请注意我对样本加入ID(即GSM258609 GSM258610等)不感兴趣,我想要的是样本人类可读标题。

有什么想法吗?感谢

1 个答案:

答案 0 :(得分:3)

gset <- getGEO("GSE10246", GSEMatrix =TRUE)

gset是一个简单的列表,它的第一个元素是ExpressionSet,示例信息位于phenoDatapData,所以也许你正在寻找

pData(gset[[1]])

有关详情,请参阅?ExpressionSet