我有一个庞大的数据集,其中包含数百个文件,我需要使用bigmemory(或类似的)程序包来读取数据。如何将read.big.matrix与多个文件一起使用?
答案 0 :(得分:-1)
可能可以从工作目录中迭代地加载文件,然后合并矩阵。
setwd(path_to_files)
files <- list.files(path = ".")
number_of_matrices <- length(files)
#For faster computation set number of matrices
my_matrices <- vector("list", length = S)
for (file in 0:length(files)){
my_matrices[file] <- read.big.matrix(filename=files[file])
}
#Assuming same columns this will merge them to one single:
massive_matrix <- do.call("rbind", my_matrices)
尚未测试代码,但这可能使您了解如何解决该问题?