我尝试使用h2o.import_file
python函数从Hadoop HDFS文件系统中读取数据。我已将HADOOP_CONF_DIR环境变量设置为:
import os
os.environ["HADOOP_CONF_DIR"] = "/etc/hadoop/conf"
当我尝试使用hdfs:///path/to/my/file.txt
语法读取文件时,H2O会给出一个错误,指出Error: java.net.UnknownHostException: nameservice1
。 nameservice1
是我们的高可用性名称服务的已配置名称。它不是一个主机。 hdfs-site.xml
配置定义了如何联系nameservice1
的名称节点。如何在此配置中让H2O访问HDFS?