我正在开发一个Web应用程序,我想执行两种统计/建模操作。
(1)从我的应用程序后端(HBase集群)中存储的数据进行批量分析。通常,这种操作需要定期进行,比如每晚。数据的大小可能超过可以存储在本地内存中的数据,因此可能需要调用某些支持并行计算的程序包。 (2)由前端用户请求触发的动态R执行。典型用例包括小时间序列的预测。用户可以在同一时间发出请求,因此应该支持并发。性能至关重要,因为用户不能无限期地等待响应。
我的问题是:解决这两个问题的技术/ CRAN包的最佳组合是什么? 我现在的想法是:
我看到RevoDeployR是一个很棒的工具,但不是开源的,不是吗?
感谢您的帮助
答案 0 :(得分:5)
我建议使用RApache(http://rapache.net /)和R包RJSONIO或rjson
答案 1 :(得分:4)
看看Rook package。它可以将任何R会话转换为Web服务器。它是quite simple,事实上,在Rapache中使用。
修改的
自从我的第一个回答以来,我开始使用shiny。这是一个很棒的软件包,用于创建具有高级R接口的动态,复杂,AJAX驱动的网页,而无需完全或几乎不需要HTML。
答案 2 :(得分:0)
我试过从RStudio发光,它就像一个魅力