应用错误收集

Redshift COPY还是快照？

时间：2017-07-02 14:10:25

标签： amazon-web-services amazon-redshift amazon-athena

我正在考虑使用AWS Redshift让用户针对我的网页中无法使用的旧存档数据提交查询。

我在所有用户中处理的总数据是几兆兆字节。数据已经在一个s3存储桶中，按周拆分成文件。大多数请求都不会处理超过100GB的文件。

如果我使用快照并在不使用时删除我们的群集，或者我应该拥有一个不包含所有数据的小型群集，并且在运行时只将来自S3的COPY数据复制到临时表中，那么

可以降低成本查询？

1 个答案:

答案 0 :(得分：0)

如果您只是偶尔进行成本比速度更重要的查询，可以考虑使用Amazon Athena，它可以查询存储在Amazon S3中的数据。（目前仅限于某些AWS区域。）您只需为从磁盘读取的数据量付费。

要让雅典娜获得更高的价值，请参阅：Analyzing Data in S3 using Amazon Athena

Amazon Redshift Spectrum可以执行与Athena类似的工作，但需要运行Amazon Redshift群集。

所有其他选择实际上都是在成本和数据访问之间进行权衡。您可以先启动Amazon Redshift数据库的快照，然后在晚上和周末关闭。然后，有一个脚本可以自动恢复它以进行查询。 使用更少的节点来降低成本 - 这会降低查询速度，但这对您来说似乎不是问题。

相关问题

Maven归档程序在类路径中使用未锁定的快照，但复制依赖项复制锁定的快照

Amazon RedShift中的'copy'命令是否原子？

使用快照复制Azure Blob

AWS Redshift - 手动快照是增量的吗？

复制命令无法将日期复制到Redshift

Redshift ROLLBACK for COPY

Redshift COPY还是快照？

Terraform是否允许为Redshift群集配置跨区域快照？

Redshift复制命令是追加，替换还是向上插入？

最新问题

我写了这段代码，但我无法理解我的错误

我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？

是否有可能使 loadstring 不可能等于打印？卢阿

java中的random.expovariate()

Appscript 通过会议在 Google 日历中发送电子邮件和创建活动

为什么我的 Onclick 箭头功能在 React 中不起作用？

在此代码中是否有使用“this”的替代方法？

在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化

每千个数字得到

更新了城市边界 KML 文件的来源？