如何恢复以前快照中不存在的红移数据?

时间:2017-03-13 13:39:29

标签: amazon-web-services amazon-s3 amazon-redshift

目前,我们每1小时自动手动备份一次红移数据。 假设群集关闭并且数据从快照恢复,我还想恢复快照中不存在的数据。

P.S:在我们转向红移之前,s3中存在完整的数据。

我该如何处理这个问题?这样我就可以在快照恢复后从s3获取剩余数据到红移。

1 个答案:

答案 0 :(得分:2)

您需要在Redshift和S3中都有一些指示符,以便您知道加载了哪些数据。

例如,如果S3上的数据按年,月,日和小时分区,则如下:

s3://my_bucket/my_prefix/year=2017/month=3/day=11/hour=10/my_file_parts.pt001.gz

然后,您希望在Redshift表中包含Year,Month,Day和Hour列,以便找到已加载的最大分区。

SELECT  MAX(year||month||day||hour) FROM my_table

然后,您可以重新加载Redshift中当前不存在的任何分区。