Python脚本可将数据从AWS S3加载到Redshift

时间:2018-09-17 06:48:34

标签: python-2.7 amazon-web-services amazon-s3

有人在创建python脚本来将数据从s3加载到多个文件的redshift表中的工作。我们如何在AWS CLI中实现它。感谢您的学习和投入。

1 个答案:

答案 0 :(得分:1)

COPY command是将数据从Amazon S3加载到Amazon Redshift的最佳方法。它可以将多个文件并行加载到一个表中。

使用任何Python库(例如PostgreSQL + Python | Psycopg)连接到Amazon Redshift,然后发出COPY命令。

AWS Command-Line Interface (CLI)不能 能够在Redshift上运行COPY命令,因为它需要发布到数据库,而AWS CLI向AWS发出命令。 (AWS CLI可用于启动/终止Redshift集群,但不能连接到集群本身。)