如何在Revolution R Enterprise或R Studio中导入大型数据集?

时间:2016-04-21 15:18:54

标签: r

我目前正在使用 Revolution R企业版7.5

我正在尝试将 Excel中的数据集导入RRE 。这是我的代码:

library("dplyr")
library("XLConnectJars")
library("XLConnect")

dataset1 <- readWorksheetFromFile(file.choose(), sheet=1, startRow=1, Header=T)

当我尝试执行这段代码时,这就是我得到的错误:

Error: OutOfMemoryError (Java): GC overhead limit exceeded

无论如何都要将大量数据输入 Revolution R Enterprise ?也许我可以使用一些 RevoScaleR 库函数?

甚至 R Studio 中的帮助也可以。

1 个答案:

答案 0 :(得分:1)

虽然我还没有使用过这个特定的软件包(XLConnect),但是你得到的错误是因为它导入了rJava。您需要使用以下命令更改分配的Java堆大小:

options(java.parameters="-Xmx4g")

这会将其从512MB的默认值更改为4GB;如果您愿意,可以选择不同的值。

您需要在加载库之前运行该命令。如果我是你,我会重启你的R会话,运行该命令,然后继续。