无法加载数据以运行deeplearning_mnist_introduction笔记本

时间:2017-12-15 09:18:54

标签: python h2o

我尝试使用TensorFlow作为后端运行H2O深水。与python一起使用的installation运行顺利,没有任何错误。现在我想运行deeplearning_mnist_introduction notebook但是在开始时加载数据的函数会返回错误。

test_df = h2o.import_file(PATH + "bigdata/laptop/mnist/test.csv.gz")

...
/home/my_user_name/anaconda3/envs/h2o-tf-gpu/lib/python2.7/site-packages/h2o/backend/connection.pyc in _process_response(response, save_to)
    723         # Client errors (400 = "Bad Request", 404 = "Not Found", 412 = "Precondition Failed")
    724         if status_code in {400, 404, 412} and isinstance(data, (H2OErrorV3, H2OModelBuilderErrorV3)):
--> 725             raise H2OResponseError(data)
    726 
    727         # Server errors (notably 500 = "Server Error")

H2OResponseError: Server error water.exceptions.H2ONotFoundArgumentException:
  Error: File /home/my_user_name/h2o-3/bigdata/laptop/mnist/test.csv.gz does not exist
  Request: GET /3/ImportFiles
    params: {u'path': '/home/my_user_name/h2o-3/bigdata/laptop/mnist/test.csv.gz'}

我的猜测是一些不再有效的硬编码网址。

有没有办法修复网址或只是指向我的数据集,以便我可以手动下载?

我的设置是:

  • CentOS 7.3.1611

  • Python 2.7.14(虽然我可以根据需要安装其他版本)

  • h2o-3(按照指示here从夜间建造)

  • tf 1.4(从here安装的pip)

1 个答案:

答案 0 :(得分:0)

如果您查看笔记本的顶部,您将看到以下PATH设置,该设置被设置为硬编码路径:

PATH = os.path.expanduser("~/h2o-3/")

首先从下面的直接链接下载数据集并设置正确的路径:

现在将PATH更改为数据集可用的位置:

 PATH = "/your_pyhsical_path/"

还要确保test_df和train_df指向上面的正确数据集。

注意:深水项目不再处于积极开发状态,因此H2O没有进一步的开发,它可以原样使用。