尝试将数据帧火花保存到hdfs文件时发生错误

时间:2020-05-03 20:42:43

标签: apache-spark pyspark apache-spark-sql spark-streaming

使用ubuntu即时通讯

当我尝试将数据帧保存到HDFS(Spark Scala)时: procesed.write.format(“ json”).save(“ hdfs:// localhost:54310 / mydata / enedis / POC / processed.json”)

我遇到此错误

起因:org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.security.AccessControlException):权限被拒绝:user = root,access = WRITE,inode =“ / mydata / enedis / POC”:hadoop_amine :supergroup:drwxr-xr-x

1 个答案:

答案 0 :(得分:1)

您正尝试以root用户身份写入数据,但hdfs目录(/ mydata / enedis / POC)有权让hadoop_amine用户写入目录。

更改HDFS目录上的permissions,以允许root用户写入/mydata/enedis/POC目录。

#login as hadoop_amine user then execute below command
hdfs dfs –chmod -R 777  /mydata/enedis/POC

(Or)

使用hadoop_amine用户初始化spark shell,然后无需更改目录的权限。

相关问题