Question

我正尝试在https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE22358

上分析（用R）从GEO获得的安捷伦微阵列

与我惯用的GEO样本相反，没有补充文件，并且指出“原始数据已包含在Sample表中”。我从以下链接下载了它们：https://ftp.ncbi.nlm.nih.gov/geo/series/GSE22nnn/GSE22358/miniml/GSE22358_family.xml.tgz 然后，我解压缩了它们，并尝试使用Limma软件包中的read.maimages函数对其进行处理

sample_names<-list.files("GSE22358_family.xml",pattern = "^GSM")
GEO_Sample_path <-"GSE22358_family.xml"
dat <- read.maimages(files=sample_names , path= GEO_Sample_path)

但是我有此错误消息：

Error in read.maimages(files = sample_names) : 
  must specify columns for generic input

在read.maimages帮助中，它说：“ *列应具有R，G，Rb和Gb字段，以提供用于红色和绿色前景和背景的列名称”。事实是我的.txt文件甚至都没有列名，但是我在GEO网站上找到了它们： “ ID_REF”，“ VALUE”，“ SPOT”，“ CH1_MEAN”，“ CH1_SD”，“ CH1_BKD_MEDIAN”，“ CH1_BKD_SD”，“ CH2_MEAN”，“ CH2_SD”，“ CH2_BKD_MEDIAN”，“ CH2_BKD_SD”，“ TOT_BPIX” ”，“ CH2BN_MEDIAN”，“ CH2IN_MEAN”，“ CH1DL_MEAN”，“ CH2DL_MEAN”，“ LOG_RAT2N_MEAN”，“ CORR”，“ FLAG”

我什至不知道CH1和CH2是哪种颜色，因为该平台被称为“智人1X44K自定义阵列”

这是我第一次使用安捷伦微阵列（我已经习惯Affymetrix），而且我不确定它是否是安捷伦原始数据的常规格式（我无法从中找到相同的安捷伦原始数据除此以外，GEO上的另一个实验室）

是常规格式吗？如果是的话，是否有人有打包/链接/建议来处理它们？

不常见的原始数据格式对GEO Agilent定制阵列进行分析

0 个答案: