我正在尝试使用SparkR来构建后端,我在其中运行随机林模型。但我需要决策树,而sparkR则没有。此外,sparkR缺乏适当的文档。另外,我不知道在Python中是否有像Rshiny这样简单的东西。所以我想知道是否可以使用Pyspark和ShinyR构建应用程序。
答案 0 :(得分:0)
对于快速运行的网络应用程序,我发现闪亮非常有用。我从R服务器调用.py
脚本并且运行良好,但由于必须启动会话并分配资源,所以它有点慢。
我发现最好的解决方法是使用火花流。它检查新文件是否已通过闪亮写入目录,读取它们,处理它们并写入输出结果(您可以滞后R服务器,以便它有时间写入输出,然后将它们读入R)。
对于易于使用的基于python的框架,您可以查看python-dash
。