我创建了一个集群并通过SQL Workbench连接到数据库,但是如何通过SQL将数据上传到Amazon Redshift?
我想我必须使用Amazon S3,但我找不到能够很好地描述它的示例视频或文字。
答案 0 :(得分:1)
有两种方法可以将信息插入Amazon Redshift:
COPY
命令INSERT
声明 不推荐使用INSERT
语句,因为它们对大数据量无效。它们可以用于执行ETL类型的过程,例如在表之间复制数据,但作为一般规则,数据应该通过COPY
加载。
根据Using a COPY Command to Load Data,COPY
命令可以从以下位置加载数据:
Amazon S3的负载在所有节点上并行执行 ,是加载数据的最有效方式。
Amazon Redshift COPY command可以读取多种文件格式:
底线:以兼容格式将数据导入Amazon S3,然后使用COPY
加载。
另外,请尝试了解DISTKEY
和SORTKEY
以获得Redshift的全部性能优势。 绝对阅读手册 - 它将为您节省比阅读时间更长的时间!