从S3

时间:2015-05-27 09:07:20

标签: amazon-web-services amazon-s3 amazon-redshift

AWS和RedShift非常新,所以请放慢速度。 我正在试图弄清楚如何将我上传到S3的csv文件中的数据加载到Redshift集群中。我已经设法创建了所需的表,但是当我尝试运行Copy命令将S3中的数据加载到表中时(使用SQLWorkbench),我收到以下错误;

  

无效操作:S3ServiceException:您尝试的存储桶   必须使用指定的端点寻址访问。请发送所有   将来对此端点的请求。

一些谷歌搜索会告诉您这意味着S3存储桶和Redshift集群不在同一区域。但是,集群和存储桶都位于ap-southeast-1(新加坡)区域。使用此区域代码指定REGION命令没有帮助,并返回相同的错误。

我的复制命令:

copy dim_products
from 's3://s3-ap-southeast-1.amazonaws.com/dwh-dimensions/dim-products/dim_products.csv' 
CREDENTIALS 'aws_access_key_id=removed;aws_secret_access_key=removed' delimiter ';' 
timeformat 'YYYY-MM-DD HH:MI:SS'
csv
REGION 'ap-southeast-1';

我的红移群集的区域位于东南方向1b,因此该区域与水桶(新加坡)相同。 我在这里不知所措,我需要尽快提出这个可行的数据仓库管理解决方案。任何帮助将不胜感激。 感谢。

1 个答案:

答案 0 :(得分:1)

变化 S3://s3-ap-southeast-1.amazonaws.com/dwh-dimensions/dim-products/dim_products.csv

S3://dwh-dimensions/dim-products/dim_products.csv