如何使用Python从H2O生成和保存POJO

时间:2016-08-24 16:43:55

标签: python pojo h2o

我使用Python在H2O中创建了一个模型。我想生成该模型的POJO并保存它。

说我的模型叫做model_rf。

我试过了:

h2o.save_model(model_rf, path='./pojo_test', force=False)

这将创建一个名为" pojo_test"的目录,其中包含一大堆二进制文件。我想要一个java文件,比如model_rf.java,就是POJO本身。

我试过了:

h2o.download_pojo(model_rf, path='./pojo_test_2', get_jar = True)

提供了错误消息:

IOError: [Errno 2] No such file or directory: u'./pojo_test_2/model_rf.java'

我错过了什么?可能是一个愚蠢的问题,但我不能为我的生活弄清楚这一点。

1 个答案:

答案 0 :(得分:2)

一切看起来都很好,看起来你需要更改你使用的path

不使用h2o.save_model创建的目录,而是使用您知道存在且知道路径的目录。作为第一个测试,您可以保存到桌面,例如使用

h2o.download_pojo(model_rf, path = '/Users/your_user_name/Desktop/', get_jar = True)

您需要替换your_user_name(假设您使用的是mac)

以下是您可以从头开始尝试的示例(首先使用h2o.cluster().shutdown()

关闭h2o
     import h2o
     h2o.init()
     iris_df = h2o.import_file("https://s3.amazonaws.com/h2o-public-test-data/smalldata/iris/iris.csv")
     from h2o.estimators.glm import H2OGeneralizedLinearEstimator
     predictors = iris_df.columns[0:4]
     response_col = "C5"
     train,valid,test = iris_df.split_frame([.7,.15], seed =1234)
     glm_model = H2OGeneralizedLinearEstimator(family="multinomial")
     glm_model.train(predictors, response_col, training_frame = train, validation_frame = valid)
     h2o.download_pojo(glm_model, path = '/Users/your_user_name/Desktop/', get_jar = True)

再次需要替换your_user_name(假设您使用的是mac)

(可能发生了什么:看起来第一次将H2O模型保存到磁盘h2o.save_model,在您运行原始h2o集群的位置创建了一个目录(检查是否连接到来自不同位置的h2o集群)第二次尝试使用download_pojo保存模型时,它查看了当前目录,并看到那里不存在'pojo_test2'。

当您运行h2o.save_model时,它将打印出创建新目录的完整路径。查看该路径是否与当前目录相同。