我有一个CSV文件(220万行,大小6.5 GB),其中我需要将数据行乘以3/4倍,所以我得到了大约6-10百万行。
第一次使用R做任何事,因此R甚至可能不是完成该任务的最佳工具(我认为可能是这样)。
到目前为止,我所能做的就是使用以下命令将数据加载到数据框中:
df <- read.table("MyFilePath",
header = TRUE,
sep = ",")
我从这里去哪里?
答案 0 :(得分:1)
一个简单的for循环和rbind
可以做到:
repetitions <- 5
for (i in 1:repetitions) {
df <- rbind(df, df)
}
您可以将重复次数更改为任意值。请记住,每次都会翻倍,所以您从2变为4到8 ...