导入SparkR的R包(不在CRAN上)

时间:2016-03-13 13:55:13

标签: r sparkr r-package

此问题与this有关:在编写程序包时,如何在现有R程序包上指定依赖项(在ImportsDepends中) CRAN。

我正在编写一个导入SparkR的R包,它不再存在于CRAN中(它与R文件夹中的Spark一起提供)。我已经尝试将GitHub链接添加到Additional_repositories文件的DESCRIPTION字段中的http://github.com/apache/spark/tree/master/R/pkg,但没有运气,因为R CMD命令(安装,检查等)一直在抱怨{{无法找到1}}。已经讨论了同样的问题in this post。就我而言,我的软件包也非常依赖SparkR将其移至SparkR

请您建议一个合适的方法来解决这个问题,而不是假设SparkR文件夹已经存在于用户的R库文件夹中。

由于

2 个答案:

答案 0 :(得分:1)

假设您的用户已安装SparkR有什么问题?如果他们使用Spark,那么他们已经拥有了它(因为你说它带有Spark)。如果他们不使用Spark,那么他们就不需要它(并且可能他们也不需要你的包装)。如果它有问题,请在您的文档中放置有关安装SparkR的消息。

如果你只想要SparkR中的一个函数在Spark之外有用,那么只需将它复制到你自己的代码中(并确认源代码)。 SparkR为Apache licensed,因此您可以执行此操作。或者如果你不想复制,那就写下你自己的。

答案 1 :(得分:0)

两种选择: 1.向用户提供有关如何安装此特定软件包的说明(请参阅help(install.packages) - 一旦您知道该路径,它就是一行) 2.运行你自己的回购。包drat可以帮助你在github上运行你自己的repo。