无法从以pyspark内核运行的emr笔记本中的s3存储桶下载文件

时间:2020-06-27 06:12:55

标签: amazon-s3 pyspark jupyter-notebook amazon-emr

我已经建立了一个带有spark和其他工具的emr集群,但是当启动emr笔记本并尝试访问s3存储桶文件时,我无法从s3下载该文件,但出现权限被拒绝的错误。所有默认角色都可以访问s3。

enter image description here

1 个答案:

答案 0 :(得分:4)

被拒绝的权限在emr写入侧,而不是s3读取。尝试将其下载到/tmp/位置