快速评估损坏的Affymetrix CEL文件

时间:2009-11-24 16:22:52

标签: r bioinformatics

我正在尝试使用R来规范化大量的Affymetrix CEL文件。但是,其中一些似乎被截断了,所以在阅读它们时我会收到错误

Cel file xxx does not seem to have the correct dimensions

规范化停止了。手动删除损坏的文件并每次重新启动将花费很长时间。你知道是否有一种快速方式(在R中或使用工具)来检测损坏的文件吗?

PS我99.99%肯定我在同一平台上将CEL正常化,它实际上只是截断文件: - )

1 个答案:

答案 0 :(得分:4)

一个简单的建议:

你可以在read.table(或者你正在使用哪个读命令)周围使用tryCatch块吗?如果收到错误消息,则跳过一个文件。您还可以在catch块中编译已损坏文件的列表(我建议您这样做,以便在运行像这样的大批处理时跟踪损坏的文件以供将来参考)。这是伪代码:

corrupted.files <- data.frame()
for(i in 1:nrow(files)) {
    x <- tryCatch(read.table(file=files[i]), error = function(e) 
         if(e=="something") { corrupted.files <- rbind(corrupted.files, files[i]) } 
         else { stop(e) }, 
       finally=print(paste("finished with", files[i], "at", Sys.time())))
    if(nrow(x)) # do something with the uncorrupted data            
}