我知道R,我知道SQL,我使用Windows,我有0美元的预算,我有1TB的数据,我有12个处理器,我有96GB的RAM,我有动力学习新的软件,如果速度收益将在长期内得到回报。
我需要运行描述性统计和回归。
我有太多选择。我应该把我所有的精力投入到哪里?感谢。
答案 0 :(得分:0)
嗯, 是个大话题。
我们确实写了一个你可以开始的survey paper of the state of the art of parallel processing with R。虽然现在已经有三年了,但讨论的大部分内容仍然存在。
否则,我会建议从中小尺寸开始,对你来说真的很重要,并试着让它更快。在r-sig-HPC list (gmane link)列表中,很多人都很乐意帮助解决具体问题。