Question

Amazon提供了非常详细的文档，用于将数据从EMR复制到Redshift（通过S3），但是似乎没有其他文档，这使我想知道加载数据是否是个好习惯从红移到EMR（直接或通过某种媒介）

理论上我不明白为什么不这样做，但我不知道它的后果

Answer 1

我认为您可以使用Redshift Unload。将数据导出为Parquet，然后从EMR Hadoop（Spark，Hive）读取数据

UNLOAD ('select-statement')
TO 's3://object-path/name-prefix'
authorization
FORMAT PARQUET