标签: hadoop amazon-s3 apache-pig sftp
我有大量非常大的文件(以GB为单位),需要从远程SFTP服务器有效地复制到AWS S3存储桶。我正在考虑使用在AWS Elastic MapReduce(EMR)集群中运行的Pig脚本,但是已经可以查找有关如何创建脚本以执行任务的特定信息。这是否可以使用Pig脚本实现,如果是,是否有一个我可以遵循的示例?