与另一个用户一起运行用户本地jupyter安装

时间:2017-02-09 16:29:29

标签: apache-spark hdfs jupyter-notebook apache-toree

我已经使用--user选项安装了jupyter,它运行正常。我需要在笔记本中运行spark并从HDFS读取并且与我的个人用户一起运行jupyter会在HDFS中创建文件权限问题。因此,我决定使用hdfs用户运行它(我们的集群已配置为所有spark作业应该由此hdfs用户运行)但是它无法找到我个人用户的/home/myuser/.local文件夹中的依赖项。有没有办法告诉jupyter作为当前用户(hdfs)运行,但在另一个用户的家中寻找二进制文件和依赖项?

此外,我正在使用toree作为网关,如果这可以打开更多选项。

1 个答案:

答案 0 :(得分:0)

尝试旧的Hadoop技巧:

  • 在您自己的用户下运行Spark会话
  • 但在Spark环境中,插入export HADOOP_USER_NAME=hdfs命令,以便驱动程序在分配YARN执行程序时注册为hdfs

(当然不能与Kerberos一起使用;但是这是针对Kerberos进行hdfs身份验证的问题......)