在AWS ParallelCluster上访问s3存储桶

时间:2020-07-15 04:12:06

标签: amazon-web-services amazon-s3 amazon-ec2

我需要访问AWS ParallelCluster节点上的S3存储桶。我确实在ParallelCluster文档中探讨了s3_read_write_resource选项。但是,关于如何访问存储桶尚不清楚。例如,将其安装在节点上,还是默认情况下用户将能够访问它。我确实通过尝试访问使用配置文件中的s3_read_write_resource选项声明的存储桶来测试后者,但无法访问它(aws s3 ls s3://<name-of-the-bucket>)。

我确实遇到了this github问题,谈到了使用s3fs安装S3存储桶。以我的经验,使用s3fs访问对象非常慢。

所以,我的问题是,

在AWS ParallelCluster配置文件中使用s3_read_write_resource选项时如何访问S3存储桶

1 个答案:

答案 0 :(得分:0)

在ParallelCluster中使用这些参数来包括为群集实例创建的实例角色的S3权限。它们被映射到Cloudformation模板parameters S3ReadResource和S3ReadWriteResource中。后来在Cloudformation模板中使用。例如,herehere。没有访问S3对象的特殊方法。

要在一个群集实例上访问S3,我们需要使用aws cli或任何SDK。将使用实例元数据服务从instance role自动获得凭据。

请注意,ParallelCluster不授予列出S3对象的权限。

从s3_read_resource中定义的S3存储桶中检索现有对象,以及将对象检索和写入s3_read_write_resource中定义的S3存储桶中都可以。

但是,“ aws s3 ls”或“ aws s3 ls s3:// name-of-the-bucket”需要其他权限。参见https://aws.amazon.com/premiumsupport/knowledge-center/s3-access-denied-listobjects-sync/

我不会使用s3fs,因为它不受AWS支持,据报道它运行缓慢(如您所知),并且运行other reasons

您可能要检查FSx section。它可以为Lustre文件系统创建一个FSx附件。它可以本地将文件导入S3或从S3导出文件。我们只需要在此部分设置import_path和export_path。