如果我不关心插入速度,我应该在Redshift中使用S3吗?

时间:2016-05-26 23:10:26

标签: amazon-s3 amazon-redshift

我有一堆数据要存储并进行分析。基于定价和数据关系,Redshift似乎是正确的选择。但是,我一直在文档和最佳实践中看到的东西,我应该使用S3并将我的数据批量复制到Redshift中。让我们假设我根本不关心插入速度,我只关心我为这些服务支付的金额。如果我使用S3和Redshift,我基本上付出双倍的代价,而且我有更多的代码要编写。为什么(财务上)我不应该直接使用JDBC将数据插入Redshift?

1 个答案:

答案 0 :(得分:0)

我认为这个想法是将它直接加载到Redshift所需的时间比加载到S3 +需要更长的时间,这使得RedShift从S3中获取它。 所以你需要做的数学是:将它加载到Redshift需要多长时间?在负载正在进行且你没有对数据做任何事情时,你要保持Redshift运行多少(并支付费用)?
如果上传到S3并在之后启动Redshift,您需要付多少钱? 猜测(但记住这是一个猜测),如果你通过S3,它会稍微便宜一点。
基本上你想使用S3来加快上传速度+与Redshift成本相比,S3中的存储成本是微不足道的,你也可以使用S3作为对数据进行其他处理的源。