我正在尝试在 R 中阅读一张大表(大约500000 x 1000)。
read.table
有效,但速度非常慢。
scan
也有效,并且速度正常,但我无法将其格式更改为正常的data.frame或矩阵。
我事先不知道表格中的行数(我可以通过template_line <- read.table(nrow=1,file=my_file)
找到列数)。它需要与 R 2.15兼容 - 所以看起来fread
是不可能的。
所以问题是:如何转换输出:
my_matrix <- scan(file=my_file,what=template_line);
到data.frame或矩阵(快)?
或者:如果我不知道尺寸,如何在 R 中快速读取整数表?
答案 0 :(得分:0)
这个怎么样?
num_cols <- 5
my_matrix <- matrix(scan(file=my_file, what=template_line), ncol=num_cols, byrow=TRUE)