我使用Python在H2O中创建了一个模型。我想生成该模型的POJO并保存它。
说我的模型叫做model_rf。
我试过了:
h2o.save_model(model_rf, path='./pojo_test', force=False)
这将创建一个名为" pojo_test"的目录,其中包含一大堆二进制文件。我想要一个java文件,比如model_rf.java,就是POJO本身。
我试过了:
h2o.download_pojo(model_rf, path='./pojo_test_2', get_jar = True)
提供了错误消息:
IOError: [Errno 2] No such file or directory: u'./pojo_test_2/model_rf.java'
我错过了什么?可能是一个愚蠢的问题,但我不能为我的生活弄清楚这一点。
答案 0 :(得分:2)
一切看起来都很好,看起来你需要更改你使用的path
。
不使用h2o.save_model
创建的目录,而是使用您知道存在且知道路径的目录。作为第一个测试,您可以保存到桌面,例如使用
h2o.download_pojo(model_rf, path = '/Users/your_user_name/Desktop/', get_jar = True)
您需要替换your_user_name(假设您使用的是mac)
以下是您可以从头开始尝试的示例(首先使用h2o.cluster().shutdown()
import h2o
h2o.init()
iris_df = h2o.import_file("https://s3.amazonaws.com/h2o-public-test-data/smalldata/iris/iris.csv")
from h2o.estimators.glm import H2OGeneralizedLinearEstimator
predictors = iris_df.columns[0:4]
response_col = "C5"
train,valid,test = iris_df.split_frame([.7,.15], seed =1234)
glm_model = H2OGeneralizedLinearEstimator(family="multinomial")
glm_model.train(predictors, response_col, training_frame = train, validation_frame = valid)
h2o.download_pojo(glm_model, path = '/Users/your_user_name/Desktop/', get_jar = True)
再次需要替换your_user_name
(假设您使用的是mac)
(可能发生了什么:看起来第一次将H2O模型保存到磁盘h2o.save_model
,在您运行原始h2o集群的位置创建了一个目录(检查是否连接到来自不同位置的h2o集群)第二次尝试使用download_pojo
保存模型时,它查看了当前目录,并看到那里不存在'pojo_test2'。
当您运行h2o.save_model
时,它将打印出创建新目录的完整路径。查看该路径是否与当前目录相同。