GEOquery是一个很棒的R软件包,用于检索和分析NCBI Gene Expression Omnibus (GEO) database中存储的基因表达数据。我使用了GEO数据库GEO2R服务提供的以下代码(生成初始R脚本来自动分析您想要的数据),以提取一些GEO系列实验:
gset <- getGEO("GSE10246", GSEMatrix =TRUE)
if (length(gset) > 1) idx <- grep("GPL1261", attr(gset, "names")) else idx <- 1
gset <- gset[[idx]]
gset # displays a summary of the data stored in this variable
问题是我无法从中检索样本标题。我找到了一些函数Columns()
,它可以在GDS数据集上运行并返回样本名称,但不会返回GSE。
请注意我对样本加入ID(即GSM258609 GSM258610等)不感兴趣,我想要的是样本人类可读标题。
有什么想法吗?感谢
答案 0 :(得分:3)
在
gset <- getGEO("GSE10246", GSEMatrix =TRUE)
gset
是一个简单的列表,它的第一个元素是ExpressionSet
,示例信息位于phenoData
或pData
,所以也许你正在寻找
pData(gset[[1]])
有关详情,请参阅?ExpressionSet
。