在R中通过大数据分析来决定在哪里投入时间的问题

时间:2012-10-19 13:40:56

标签: r data-analysis

我知道R,我知道SQL,我使用Windows,我有0美元的预算,我有1TB的数据,我有12个处理器,我有96GB的RAM,我有动力学习新的软件,如果速度收益将在长期内得到回报。

我需要运行描述性统计和回归。

我有太多选择。我应该把我所有的精力投入到哪里?感谢。

1 个答案:

答案 0 :(得分:0)

嗯, 是个大话题。

我们确实写了一个你可以开始的survey paper of the state of the art of parallel processing with R。虽然现在已经有三年了,但讨论的大部分内容仍然存在。

否则,我会建议从中小尺寸开始,对你来说真的很重要,并试着让它更快。在r-sig-HPC list (gmane link)列表中,很多人都很乐意帮助解决具体问题。