R中迭代构造的数据帧

时间:2010-10-27 13:59:28

标签: r dataframe s-plus

我对R来说比较新,并且想知道迭代构造数据帧的最有效方法(一次一行,迭代次数“n”和每行“l”的长度事先已知)

  1. 创建空数据框,每次迭代添加一行
  2. 预分配n x l数据帧,每次迭代修改一行
  3. 预分配n x l矩阵,每次迭代修改一行,从矩阵
  4. 创建数据帧
  5. 其他东西

2 个答案:

答案 0 :(得分:16)

预分配!!!

如果数据类型相同,则使用matrix。它会比data.frame快得多。

例如:

> n <- 1000      # Number of rows
> row <- 1:20*1  # one row
> 
> # Adding row, one-by-one
> Data <- data.frame()
> system.time(for(i in 1:n) Data <- rbind(Data,row))
   user  system elapsed 
   2.18    0.00    2.18 
> 
> # Pre-allocated data.frame
> Data <- as.data.frame(Data)
> system.time(for(i in 1:n) Data[i,] <- row)
   user  system elapsed 
   0.94    0.00    0.93
>
> # Pre-allocated matrix (fast!)
> Data <- as.matrix(Data)
> system.time({ for(i in 1:n) Data[i,] <- row; Data <- as.data.frame(Data) })
   user  system elapsed 
      0       0       0 

答案 1 :(得分:1)

如何首先从列表中预先分配您需要的任何列类型?

as.data.frame(list(a1 = vector(“numeric”,n),a2 = vector(“character”,n)))