由于H2o模型只能在与保存时使用的h2o相同的主要版本中重复使用,因此可以将模型另存为MOJO / POJO格式。有没有一种方法可以从python代码重用/加载这些保存的模型。还是在升级H2O版本时有什么方法可以保留模型以进行进一步开发?
答案 0 :(得分:0)
如果要使用模型通过python评分,可以使用h2o.mojo_predict_pandas或h2o.mojo_predict_csv。但是否则,如果要加载以前保存的二进制模型,则需要具有兼容的版本。
在H2O-3之外,您可以按照汤姆的建议研究pyjnius:https://github.com/kivy/pyjnius
答案 1 :(得分:0)
另一种替代方法是使用pysparkling,如果您只需要使用它来进行评分:
from pysparkling.ml import H2OMOJOModel
# Load test data to predict
df = spark.read.parquet(test_data_path)
# Load mojo model
mojo = H2OMOJOModel.createFromMojo(mojo_path)
# Make predictions
predictions = mojo.transform(df)
# Show predictions with ground truth (y_true and y_pred)
predictions.select('your_target_column', 'prediction').show()