我需要扩展一组文件,以便在我公司进行概念验证。基本上有几个1000row文件,每个文件大约有200列,我想对它们进行处理,直到达到所需的比例。这可能是1M或更多行。
输出本质上是数据的重复(听起来有点傻),我知道这一点,但我只需要证明一些东西。
我在R中使用了类似的while循环:
while(nrow(df) < 1000000) {df <- rbind(df,df);}
这似乎有效,但看起来有点计算量。它可能需要10-15分钟。
我虽然创建了一个函数(下面)并使用&#34; apply&#34;家庭功能在df,但无法成功:
scaleup_function <- function(x)
{
while(nrow(df) < 1000)
{
x <- rbind(df, df)
}
}
是否有更快更有效的方法(它不需要与rbind一起使用)?
非常感谢, 若昂
答案 0 :(得分:0)
这应该可以解决问题:
df <- matrix(0,nrow=1000,ncol=200)
reps_needed <- ceiling(1000000 / nrow(df))
df_scaled <- df[rep(1:nrow(df),reps_needed),]