不常见的原始数据格式对GEO Agilent定制阵列进行分析

时间:2018-07-05 17:45:06

标签: r limma

我正尝试在https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE22358

上分析(用R)从GEO获得的安捷伦微阵列

与我惯用的GEO样本相反,没有补充文件,并且指出“原始数据已包含在Sample表中”。 我从以下链接下载了它们:https://ftp.ncbi.nlm.nih.gov/geo/series/GSE22nnn/GSE22358/miniml/GSE22358_family.xml.tgz 然后,我解压缩了它们,并尝试使用Limma软件包中的read.maimages函数对其进行处理

sample_names<-list.files("GSE22358_family.xml",pattern = "^GSM")
GEO_Sample_path <-"GSE22358_family.xml"
dat <- read.maimages(files=sample_names , path= GEO_Sample_path)

但是我有此错误消息:

Error in read.maimages(files = sample_names) : 
  must specify columns for generic input

在read.maimages帮助中,它说:“ *列应具有R,G,Rb和Gb字段,以提供用于红色和绿色前景和背景的列名称”。 事实是我的.txt文件甚至都没有列名,但是我在GEO网站上找到了它们: “ ID_REF”,“ VALUE”,“ SPOT”,“ CH1_MEAN”,“ CH1_SD”,“ CH1_BKD_MEDIAN”,“ CH1_BKD_SD”,“ CH2_MEAN”,“ CH2_SD”,“ CH2_BKD_MEDIAN”,“ CH2_BKD_SD”,“ TOT_BPIX” ”,“ CH2BN_MEDIAN”,“ CH2IN_MEAN”,“ CH1DL_MEAN”,“ CH2DL_MEAN”,“ LOG_RAT2N_MEAN”,“ CORR”,“ FLAG”

我什至不知道CH1和CH2是哪种颜色,因为该平台被称为“智人1X44K自定义阵列”

这是我第一次使用安捷伦微阵列(我已经习惯Affymetrix),而且我不确定它是否是安捷伦原始数据的常规格式(我无法从中找到相同的安捷伦原始数据除此以外,GEO上的另一个实验室)

是常规格式吗? 如果是的话,是否有人有打包/链接/建议来处理它们?

0 个答案:

没有答案