无法将文件从本地文件系统复制到cloudera上的hadoop / hdfs

时间:2016-12-29 10:59:56

标签: hadoop hdfs cloudera-cdh fedora-25

在fedora25上安装cloudera HDC后,我可以创建文件夹,但不能创建文件,也不能将数据从本地文件系统复制到HDFS。

这是我使用的命令:

sudo -u hdfs hadoop fs -copyFromLocal /home/mohammed/Documents/bbc.txt /kareem/corpora/

这是我从终端获得的:

SLF4J: Failed to load class "org.slf4j.impl.StaticLoggerBinder".
SLF4J: Defaulting to no-operation (NOP) logger implementation
SLF4J: See http://www.slf4j.org/codes.html#StaticLoggerBinder for further details.
copyFromLocal: '/home/mohammed/Documents/bbc.txt': No such file or directory

如何克服这个问题?

非常感谢您的帮助!

1 个答案:

答案 0 :(得分:0)

问题是您无法访问/home/mohammed的本地路径,因为用户hdfs正在运行整个命令。由于hdfs的本地Linux用户无法输入/home/mohammed,因此该命令会抛出No such file or directory错误,并因无法找到或读取所提供的文件而退出。

在大多数打包的HDFS安装中,hdfs用户通常是分布式文件系统的超级用户,管理命令通常以该用户身份运行。但是,在使用hdfs用户为常规用户配置权限和所有权后,可以而且应该以普通用户身份对数据进行工作。

对于您的情况,如果此帐户也具有sudo权限,您可以以mohammed用户身份执行以下操作:

# Superuser-provisioning part (do once)

# Ensure the HDFS directory exists by creating it as a superuser
~> sudo -u hdfs hadoop fs -mkdir -p /kareem/corpora
# Ensure also the HDFS-home path exists by creating it as a superuser
~> sudo -u hdfs hadoop fs -mkdir -p /user/mohammed
# Grant ownership entirely to user mohammed for both paths
~> sudo -u hdfs hadoop fs -chown -R mohammed:mohammed /kareem /user/mohammed

# Final usage part (continue or repeat as many times) without superuser

# Upload the local file (note the absence of sudo)
~> hadoop fs -copyFromLocal -f /home/mohammed/Documents/bbc.txt /kareem/corpora/
# Now read it, etc., all done as the regular non-'hdfs' user
~> hadoop fs -text /home/mohammed/Documents/bbc.txt