如果我需要在2个Redshift集群之间卸载数据和复制数据,那么编写该流程的最佳方法是什么?

时间:2014-03-27 20:37:28

标签: amazon-redshift

我已经通过交互式s3使用卸载/复制命令在Amazon Redshift集群之间完成了迁移数据。下一步是自动化流程,我正在寻找最佳方法。

2 个答案:

答案 0 :(得分:2)

您可以将java /任何其他语言用于以下步骤并自动化

1)连接到群集1

2)将数据卸载到亚马逊s3

3)连接到群集2

4)将数据从亚马逊s3复制到红移群集

你可以使用shell脚本或php或简单的java程序来做。

答案 1 :(得分:0)

以下是您可以尝试的两种方法:

  1. 使用python或bash脚本从一个RedShift卸载和复制数据 集群到另一个。在这种方法中,暂存区域为S3。如果 您正在尝试卸载并在单独的帐户之间复制,那么您 需要具有适当的IAM角色和信任策略。这可以是 有点挑战。您可以使用 AWS数据管道来自动执行此过程。
  2. 获取快照,并使用快照还原RedShift集群。另外,如果您想将此快照共享给其他帐户,则只需转到“管理访问”,然后放置目标RedShift群集的帐户ID。这非常简单,不需要编写任何代码。