远程访问HDFS

时间:2016-09-22 11:06:57

标签: hadoop

我在某台服务器上运行hadoop服务器,比方说IP 192.168.11.7 并使其核心site.xml如下:

<configuration>
<property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
</property>

我已经运行了我的hdfs,即使用命令:

sbin/start-dfs.sh

现在,我想通过浏览器从本地计算机访问HDFS。有可能吗?

我尝试了http://192.168.11.7:9000http://192.168.11.7:50075,但没有用。即无法访问此站点

非常感谢

编辑:

这是我的hdfs-site.xml的内容:

<configuration>
<property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
<property>
    <name>dfs.webhdfs.enabled</name>
    <value>true</value>
</property>
<property>
    <name>dfs.namenode.http-address</name>
    <value>0.0.0.0:50070</value>
</property>

和我的core-site.xml:

<configuration>
<property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
</property>

<property>
        <name>dfs.datanode.http.address</name>
        <value>0.0.0.0:50075</value>
</property>

但是当我从本地计算机访问它时http://192.168.11.7:50075,仍无济于事 有什么不对吗?

谢谢

3 个答案:

答案 0 :(得分:2)

请注意:

<property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
</property>

不适用于用户及其浏览器。当需要访问HDFS时,Java程序将读取此值。 您正在寻找的是这个关键:

<property>
        <name>dfs.datanode.http.address</name>
        <value>0.0.0.0:50075</value>
</property>

这是datanode公开其状态的地方。 要使用Web浏览器浏览HDFS,您需要激活webhdfs。

<property>
  <name>dfs.webhdfs.enabled</name>
  <value>true</value>
</property>
<property>
  <name>dfs.namenode.http-address</name>
  <value>0.0.0.0:50070</value>
</property>

进入hdfs-site.xml

然后转到http://hostname:50070从那里访问webHDFS用户界面,您可以查看所有内容。

答案 1 :(得分:1)

(现在编辑的问题)

尝试访问50070端口,这是dfs.http.address的默认值。您可以在此处访问namenode的Web界面。这应该工作。如果是,您可以先将/explorer.html#/附加到该网址 (即http://192.168.11.7:50070/explorer.html#),你应该可以从那里浏览文件系统。

请参阅此SO Answer以查看各种属性的各种端口的默认值。

或者浏览服务器中hadoop org.apache.hadoop.conf.Configuration的输出,看看如果dfs.http.address无法在您的浏览器中运行,http://192.168.11.7:50070/的值是否已更改。

基本上是这样的:

  • 检查这是否有效http://192.168.11.7:50070是否有效,如果有效则转到http://192.168.11.7:50070/explorer.html#以访问文件系统
  • 否则,请浏览hadoop org.apache.hadoop.conf.Configuration的输出,以查看此值dfs.http.address是否已更改。它可能会在那里。

[ OLD ANSWER ]

您要查找的是与远程服务器的SSH连接。我相信这nice tutorial将帮助您实现您的目标。

您不太可能使用Windows服务器,但如果您使用的话,我相信this'll可以帮助您。

执行此操作后,您将获得对远程服务器的终端访问权限。

如果您正在寻找浏览器访问权限,可以尝试类似于列出herehere的内容。

答案 2 :(得分:1)

两台机器之间应该有一些连接。配置SSH或HttpFS