我正尝试在https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE22358
上分析(用R)从GEO获得的安捷伦微阵列与我惯用的GEO样本相反,没有补充文件,并且指出“原始数据已包含在Sample表中”。 我从以下链接下载了它们:https://ftp.ncbi.nlm.nih.gov/geo/series/GSE22nnn/GSE22358/miniml/GSE22358_family.xml.tgz 然后,我解压缩了它们,并尝试使用Limma软件包中的read.maimages函数对其进行处理
sample_names<-list.files("GSE22358_family.xml",pattern = "^GSM")
GEO_Sample_path <-"GSE22358_family.xml"
dat <- read.maimages(files=sample_names , path= GEO_Sample_path)
但是我有此错误消息:
Error in read.maimages(files = sample_names) :
must specify columns for generic input
在read.maimages帮助中,它说:“ *列应具有R,G,Rb和Gb字段,以提供用于红色和绿色前景和背景的列名称”。 事实是我的.txt文件甚至都没有列名,但是我在GEO网站上找到了它们: “ ID_REF”,“ VALUE”,“ SPOT”,“ CH1_MEAN”,“ CH1_SD”,“ CH1_BKD_MEDIAN”,“ CH1_BKD_SD”,“ CH2_MEAN”,“ CH2_SD”,“ CH2_BKD_MEDIAN”,“ CH2_BKD_SD”,“ TOT_BPIX” ”,“ CH2BN_MEDIAN”,“ CH2IN_MEAN”,“ CH1DL_MEAN”,“ CH2DL_MEAN”,“ LOG_RAT2N_MEAN”,“ CORR”,“ FLAG”
我什至不知道CH1和CH2是哪种颜色,因为该平台被称为“智人1X44K自定义阵列”
这是我第一次使用安捷伦微阵列(我已经习惯Affymetrix),而且我不确定它是否是安捷伦原始数据的常规格式(我无法从中找到相同的安捷伦原始数据除此以外,GEO上的另一个实验室)
是常规格式吗? 如果是的话,是否有人有打包/链接/建议来处理它们?