Question

我需要扩展一组文件，以便在我公司进行概念验证。基本上有几个1000row文件，每个文件大约有200列，我想对它们进行处理，直到达到所需的比例。这可能是1M或更多行。

输出本质上是数据的重复（听起来有点傻），我知道这一点，但我只需要证明一些东西。

我在R中使用了类似的while循环：

while(nrow(df) < 1000000) {df <- rbind(df,df);}

这似乎有效，但看起来有点计算量。它可能需要10-15分钟。

我虽然创建了一个函数（下面）并使用＆＃34; apply＆＃34;家庭功能在df，但无法成功：

scaleup_function <- function(x) 
{ 
  while(nrow(df) < 1000)
  {
    x <- rbind(df, df)
  }

}

是否有更快更有效的方法（它不需要与rbind一起使用）？

非常感谢，若昂

Answer 1

这应该可以解决问题：

df <- matrix(0,nrow=1000,ncol=200)
reps_needed <- ceiling(1000000 / nrow(df))
df_scaled <- df[rep(1:nrow(df),reps_needed),]