"未使用的参数(replace = FALSE)" R中的sample()错误(在AWS上)

时间:2017-10-23 14:45:00

标签: r apache-spark sparkr

我在AWS上的Elastic MapReduce集群上运行R代码,涉及从S3存储桶导入的数据。我正在使用SparkR库测试Apache Spark的一些功能。这是我试图运行的代码。

mnist_train <- SparkR::read.df("s3a://spark-rstudio-test-new/mnist_train.csv", 
                  header = "false", source = "csv", 
                  inferSchema = "true", na.strings = "")
subsamplesize <- 30000
subsample <- sample(nrow(mnist_train), subsamplesize, replace = FALSE)

这会返回以下错误:

&#34;样本中的错误(nrow(mnist_train),subsamplesize,replace = F):   未使用的参数(replace = F)&#34;

同一条代码可以在我当地的RStudio上运行。这里发生了什么?我非常感谢任何方向。

1 个答案:

答案 0 :(得分:1)

看起来SparkR实现具有不兼容的签名,会使base中的一个隐藏。使用完全限定名称应该可以解决问题:

base::sample(nrow(mnist_train), subsamplesize, replace = FALSE)